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如 
了 路 


当今 程序 设计 语言 多 种 多 样 ， 可 供 阅 读 的 资料 也 非 第 多 。 但 一 个 人 
的 学 习 时 间 是 有 限 的 ， 全 部 都 学 并 不 现实 。 

另外 ， 信 息 技 术 瞬 息 万 变 ， 特 定语 言及 工具 很 快 便 已 陈旧 。 如 果 不 
能 意识 到 这 一 点 而 有 选择 性 地 学 习 一 些 相 对 稳定 的 知识 ， 所 学 的 内 容 将 
逐渐 失去 价值 。 

那么 ， 该 学 习 哪 些 知 识 并 如 何 学 习 呢 ? 笔者 认为 在 学 习 中 需要 做 到 
以 下 三 点 。 


。 在 比较 中 学 习 
。 在 历史 中 学 习 
。 在 实践 中 学 习 


第 一 条 是 指 通过 比较 多 种 语言 ， 总 结 出 某 种 语言 的 独 有 特点 ， 以 及 
多 种 语言 的 共有 特点 。 

第 二 条 是 指 通 过 退 溯 语言 的 发 展 历史 ， 了 人 解 语 言 是 如 何 产 生 、 变 化 
和 消失 的 ， 探 寻 语 言 发 展演 变 的 轨迹 。 

第 三 条 是 指 亲 目 进 行程 序 设 计 。 边 实践 边 思考 如 何 编程 ， 才 能 深入 
理解 语言 设计 者 的 意图 ， 同 时 也 能 发 现 日 己 原先 理解 不 到 位 之 处 。 

在 阅读 了 各 种 程序 设计 书籍 之 后 ， 相 信 读 者 们 都 曾 产 生 过 很 多 疑 
问 。 本 书 的 目的 就 是 解答 大 家 的 这 些 疑 惑 。 本 书 假 设 读者 对 程序 设计 还 
不 是 很 熟悉 ， 侧重 讲 解 “ 在 比较 中 学 习 ” 和 “在 历史 中 学 习 ”。 如 果 大 
家 在 阅读 本 书后 能 掌握 这 些 学 习 方 法 ， 那 我 将 不 胜 欣 喜 。 
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本 书 构 成 


本 书 共 分 为 12 章 。 

第 1 章 围 绕 如 何 深 入 高 效 地 学 习 语 言 ， 举 例 说 明 “ 在 比较 中 学 习 ” 
和 “在 历史 中 学 习 ” 两 种 学 习 方法 。 

第 2 章 探讨 程序 设计 语言 是 如 何 产生 的 。 

从 第 3 章 开 始 将 介绍 和 程序 设计 语言 相关 的 各 种 概念 。 本 书 不 以 某 
特定 语言 为 叙述 前 提 ， 如 果 讲 解 的 一 些 知 识 大 家 尚未 接触 到 ， 理 解 起 来 
可 能 有 些 困难 。 比 如 ， 只 有 C 语言 相关 经 验 的 读者 可 能 对 第 6 章 错 误 处 
理 的 内 容 理解 起 来 稍 显 吃力 。 如 果 没 有 使 用 过 线程 ， 就 不 太 好 理解 第 10 
董 的 并 行 处 理 。 这 时 ， 大 家 可 以 和 完 阅 恋 其 他 半 广 。 

第 3 草 重 点 讨论 程序 设计 语言 中 为 什么 有 那么 多 的 语法 规则 。 着 
重 介绍 运算 符 的 优先 顺序 ， 并 比较 规则 相对 较 少 的 FORTH 语言 和 
LISP 语言 。 

第 4 章 通过 比较 不 具有 控制 语句 的 汇编 语言 和 具有 控制 语句 的 C 语 
， 探 讨 证、while 、for 等 控制 语句 产生 的 原因 。 
第 5 莉 讨 论 子 数 是 如 何 产生 的 ， 并 学 习 弟 归 调 用 的 使 用 场合 。 
第 6 章 围 绕 现 在 许多 语言 中 称 为 异常 的 错误 处 理 机 制 ， 介 绍 这 一 机 

制 的 必要 性 以 及 它 的 发 展 过 程 。 

第 7 章 前 述 变量 与 图 数 的 名 字 产 生 的 原因 ， 并 介绍 作用 域 的 必要 性 


了 尼 


及 其 进化 的 过 程 。 

第 8 草 探 讨 类 型 存在 的 必要 性 。 首 先 从 数 的 表达 方法 讲 起 ， 接 春 介 
绍 类 型 及 其 应 用 。 

第 9 半 会 学 习 一 种 能 存 人 多 个 元 系 的 物体 ， 即 容 带 。 容 可 种 类 多 


样 ， 本 革 将 解释 为 什么 会 有 这 么 多 种 类 、 各 种 类 型 之 则 的 差异 ， 以 及 各 
目的 优 缺 品 。 本 曹 后 半 部 分 会 学 习 字 从 串 ， 在 历史 中 学 习 字 符 编 码 ， 并 
在 比较 中 学 习 不 同 语 言 中 学 符 串 的 差异 。 

第 10 草 讨 论 的 是 同时 执行 多 个 处 理 的 并 行 处 理 中 存在 的 问题 以 及 
它 的 规避 策略 ， 我 们 将 在 不 同 语言 的 比较 中 展开 这 部 分 内 容 。 
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Vi | 本 书 构成 


第 11 草 将 学 习 面 各 对象。 首先 ， 通 过 比较 SmallTalk 语言 和 C++ 语 
言 ， 介 绍 面向 对 象 这 一 术语 指示 的 内 容 在 不 同 语言 中 有 哪些 差异 。 接 下 
来 将 阐述 面向 对 象 发 明 的 原因 。 另 外 ， 本 章 还 会 介绍 类 和 其 他 不 同 的 对 
象 创建 机 制 。 

第 12 章 围 绕 继 承 ， 探讨 不 同 语言 中 的 继承 机 制 及 它们 各 目的 优 
缺点 。 


示例 代码 下 载 


本 书 中 的 示例 代码 ， 以 及 在 编写 本 书 过 程 中 供 验证 使 用 的 代码 ， 均 
可 从 笔者 创建 的 支持 网 站 上 下 载 。 但 因 篇 幅 所 限 ， 部 分 代码 没有 包含 在 
本 书 中 。 


http://nhiro.org/langbook/ 


本 书 是 在 次 社 杂 志 《WEB+DB PRESS 》Vol.66 特辑 之 《程序 员 应 该 知道 的 程序 设计 基础 知识 熟知 语言 核 
心 设计 如 有 神助 》( 也 口令 三 叉 从 知 吾 从 去 言语 设计 四 基础 知识 一 一 言语 四 核 顾 知 机 二 、 自 才 上 作法 从 网 元 忌 
《 台 ) 的 基础 上 ， 大 量 添 加 内 容 并 修正 之 后 编纂 而 成 。 


本 书展 示 的 代码 已 在 Mac OS 10.7.5 的 以 下 程序 语言 环境 中 运行 并 确认 过 。 不 同 的 执行 环境 可 能 市 来 操作 顺序 、 显 
示 画 面 及 执行 结果 的 差异 。 


® Scala: version 2.9.2 (Java HotSpot 64-Bit Server VM, Java 1.7.0_05) 

@ Haskell: GHCiI, version 6.10.4 

® Python: 2.7.3 

@ Ruby: 1.9.3p194 (2012-04-20 revision 35410) [x86_64-darwin11] 

@ Perl: v5.12.4 built for darwin—thread—multi-2|level 

@ JavaScript: Node.js.v0.6.18 

® Java: build 1.7.0 .05-b05 

@ C/C++: gcc version 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.9.00) 


对 于 使 用 本 书信 息 所 造成 的 后 果 ， 技 术 评论 社 、 原 书 作者 、 人 民 邮 电 出 版 社 以 及 译 者 ， 概 不 负责 。 


本 书 中 出 现 的 公司 名 称 及 商品 名 称 ， 通 常 是 各 相关 公司 的 商标 或 注册 商标 。 本 书 在 使 用 时 已 省 略 "、@、@ 等 标记 。 
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1 ] 人 2 
a = = 2 

C 语言 二 言 和 Ruby 语言 中 的 真 假 值 ER 3 

Java 1 语 三 二 言 中 的 真 假 值 EE 3 

12 1 4 
a OO 4 

应 该 学 哪 种 语言 ， 我 们 无 从 所 生 eee 4 

学 习 适 用 于 各 种 语言 二 的 知识 EE TO 5 

1.3 小 结 PA pa A ee 6 


D9 程序 设计 语 言 产生 的 原因 OREO OE A 11 
1 ey 而 

语言 们 各 有 各 的 便捷 人 12 

2D.3 小 结 人 13 
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4.3 


4.4 


Di2 


5.3 


5.4 
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2 | 第 1 章 如 何 深入 高 效 地 学 习 语 言 


“内 容 能 够 理解 ， 但 总 名 得 不 够 透彻 。 

大 家 在 学 习 编 程 的 过 程 中 有 过 这 种 感觉 吗 ? 

当 新 学 的 知识 与 自身 经 验 以 及 原来 掌握 的 知识 尚未 很 好 结合 的 时 候 ， 往 
往 会 出 现 这 种 似 懂 非 懂 的 状态 。 

“要 学 的 东西 太 多 了 ， 先 学 什么 好 呢 ?” 

六 家 曾 为 这 种 问题 震 恼 过 吗 ? 

我 们 都 想 集 中 精力 学 习 一 些 知识 要 点 ， 但 是 怎样 才能 做 到 呢 ? 


1.1 
在 比较 中 学 习 


假设 你 正在 学 习 一 种 编程 语言 XxX， 并 为 区 分 知识 要 点 和 非 要 点 而 苗 
恼 。 这 时 ， 如 采 你 开始 学 习 万 一 种 编程 语言 Y， 这 个 问题 可 能 就 会 迎 丸 
而 解 。 因 为 你 开始 了 解 那 些 因 人 语言 不 同 导致 的 差异 ,什么 规则 是 X 和 Y 
共通 的 ,什么 又 是 义 语 言 独 有 的 。 

多 种 语言 共通 的 知识 才 是 要 点 。 和 擎 握 了 这 些 要 点 ， 等 习 其 他 语言 时 
才 会 更 加 轻松 。 


| 语言 不 同 ， 规 则 不 同 


在 比较 中 学 习 多 种 语言 时 ， 一 些 知 识 能 理解 得 更 深刻 。 所 谓语 言 不 
同 ， 规 则 不 同 。 

编程 语言 的 教材 中 会 罗列 出 各 种 各 样 的 规则 。 其 实 这 些 规则 并 不 具 
有 普遍 意义 ， 只 是 因为 “在 当前 的 特定 情况 下 ， 做 此 规定 能 更 方便 ” 。 


CQ “这 样 写 更 自然 ， 那 就 规定 这 样 写 吧 。 规 定 这 东西 唾 手 可 得 。” 这 名 名 言 出 现在 人 竹 
内 郁 雄 所 著 的 《 初 由 TD 人 OO) 大 中 0D LISP[ 增补 改 订 版 ]》( 翔 泳 社 , 2010 年 出 版 。 
中 文 译 名 : LISP 基础 教程 ) 一 书 中 。 
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菏 种 二 言 的 教材 里 出 现 的 菏 菏 规则 不 过 是 该 语言 里 的 规则 ， 仅 此 而 已 。 


i C 语言 和 Ruby 语言 中 的 真 假 什 


我 们 来 看 一 下 决定 就 真 就 假 的 真 假 值 。 学 过 C 语言 的 人 都 被 告知 0 
是 假 、 其 余 为 真 。 于 是 仅仅 学 过 C 语言 的 人 就 容易 误解 为 在 程序 设计 中 
一 般 0 就 代表 假 、 其 余 为 真 。 因 此 ， 等 到 开始 学 习 Ruby 语言 ， 发 现在 
Ruby 中 0 是 真 时 ， 不免 十 分 惊讶 。 


C 语 言 中 0 是 假 ， 所 以 显示 为 "falseln 


;0G UGE <BECLGO , Ms 


| 
| 
oxilmeE (VErual \nar)s 
}elsel{ 
QPlmet (Vialsel \n")s 
} 
} 


Ruby 语 言 中 0 是 真 ， 所 以 显示 为 "trueln" 
if 0 then 


lo le We 
else 
print "false!" 


Semel 
我 们 可 以 借助 这 次 悦 然 大 悟 的 机 会 ， 来 修正 由 来 已 久 的 错误 想法 。 
即 ， 并 不 是 一 般 情 况 下 0 部 为 假 、 其 余 为 真 ， 在 C 语言 中 ，0 为 假 其 
余 为 真 ， 而 在 Ruby 中 ，false 和 nil 为 假 其 余 (包括 0 在 内 ) 都 为 真 。 
那 其 他 语言 又 是 什么 情况 ， 大 家 有 兴趣 了解 吗 ? 笔者 是 其 有 兴趣 
的 。 这 时 ， 笔 者 有 了 一 个 明确 的 目的 ， 想 知道 其 他 语言 中 真 假 是 如 何 定 
义 的 。 目 的 明确 了 ， 学 习 效 率 上 自然 而 然 就 提高 了 。 


| Java 语言 中 的 真 假 什 


笔者 比较 过 各 种 语言 ， 这 里 只 列举 其 一 。Java 语言 是 有 真 假 值 这 一 
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数据 类 型 的 ， 在 条 件 语句 中 必须 使 用 这 种 类 型 。 因 为 0 为 整 型 而 不 是 真 
假 值 类 型 ， 如 果 在 条 件 语句 中 用 0 作 判 断 条 件 ， 就 要 发 生 纺 译 错 误 。 可 
见 ，0 为 真 、0 为 假 、0 既 非 真 亦 非 假 的 语言 都 是 存在 的 。 


在 历史 中 学 习 


| 理解 语言 设计 者 的 意图 


设想 你 在 阅读 关于 编程 语言 菏 种 功能 的 介绍 时 ， 脑 子 里 总 有 一 种 不 
够 透彻 的 感觉 。 这 时 ， 你 想 知 道 为 什么 需要 这 种 功能 。 

编程 语言 也 是 人 创造 出 来 的 。 知 道 了 语言 设计 者 为 解决 何 种 问题 而 
创造 了 这 种 语言 ， 以 及 这 种 语言 经 历 过 怎么 样 的 历史 变迁 后 ， 慢 慢 地 就 
能 理解 为 什么 需要 有 这 种 功能 


| 应 该 学 哪 种 语言 ， 我 们 无 从 所 知 


本 解 了 语言 的 历史 ,我们 往往 更 能 加 深 所 学 。“ 想 学 编程 ， 但 该 学 哪 
种 语言 呢 ?” 这 个 问题 没有 意义 。 可 能 有 很 多 人 会 给 出 一 些 建 议 ， 比 如 ， 
学 好 某 某 主流 语言 就 可 以 高 枕 无 优 了 ; 今后 这 个 领域 会 有 大 的 发 展 ， 坎 
现在 赶紧 把 菏 某 语言 学 了 吧 。 但 是 ， 未 来 的 事情 谁 也 说 不 准 。 

我 们 来 看 一 下 某 种 语言 的 介绍 吧 。 为 了 便于 说 明 ， 我 们 隧 去 部 分 语 
句 ， 并 添加 一 些 补 充 注 释 来 帮助 读者 理解 。 


( 要 理解 某 些 语言 ) 我 们 需要 具备 相当 专业 的 知识 ， 因 此 使 用 起 
来 难免 感到 力不从心 。 与 此 不 同 的 是 ， 作 为 一 种 工具 ，X 这 种 语言 
能 帮助 业务 负责 人 和 管理 者 在 短 时 间 内 获得 所 需 信 息 ， 逐 渐 受 到 重 


(D 再 来 看 一 下 非 数值 的 情况 。Python 语言 中 0 为 假 ， 大 小 为 0 的 容器 也 定义 为 假 ， 
所 以 空 字 符 串 与 空 的 列表 也 为 假 。C 语言 中 用 于 处 理 字 符 串 的 Char* 即使 指向 的 
字符 串 为 空 也 不 为 假 ， 而 当 不 指向 任何 值 ( 值 为 NULL ) 时 便 为 假 。 
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视 。 最 近 两 三 年 间 ， 在 终端 用 户 所 在 部 门 普 及 X 语言 的 企业 ， 从 美 
国 迅速 扩散 到 其 他 各 国 。 在 ( X 语言 普及 较 早 的 ) 美国 某 公司 Y 
中 ， 过 去 几 年 内 ，X 语言 用 户 的 年 增长 率 超过 50% ， 约 25 000 名 
以 上 员工 在 日 常 业 务 中 以 不 同方 式 使 用 X 语言 ， 占 公司 总 员工 数 的 
16%。( 中 略 ) 在 提高 企业 生产 效率 方面 ，X 语言 被 视 为 一 种 越 来 越 
有 效 的 手段 。 


从 这 段 文字 摘 述 可 知 ，X 语言 真是 一 门 相当 不 错 的 编程 语言 。 如 末 
现在 就 有 人 劝 你 学 习 这 门 培 言 ， 你 会 动心 吗 ? 

这 篇 文 草 其 实 是 1978 年 刊登 在 日 本 信息 人 处理 协 会 杂志 上 的 一 篇 相 
当 老 的 文章 ”。 义 语言 其 实 就 是 IBM( 前 述 的 Y 公司 ) 在 1964 年 发 布 的 
APL 语言 。 如 今 , 它 的 使 用 需求 又 减 , 退出 了 主流 语言 的 舞台 “。 被 称 为 
C 语言 圣经 的 The C Programming Laneguage ”一 书 问世 的 时 间 就 是 1978 
年 。 现 今 ，C 语言 的 使 用 已 经 变 得 十 分 广泛 。 


i 学 习 适 用 于 各 种 语言 的 知识 


现在 还 有 很 多 被 不 同人 以 不 同 理由 推荐 学 习 的 编程 语言 。 然 而 ， 在 
5 年 后 、10 年 后 ， 单 个 语言 的 知识 是 否 依然 有 用 ?” 没 人 能 说 清楚 。 通 过 
比较 不 同 的 语言 、 了 解 语言 的 发 展 历史 及 其 变化 原因 ， 增 养 对 不 同 语言 
都 适用 的 理解 能 力 ， 是 非常 重要 的 。 


(DD “APL”,《 信 息 处 理 》 竹下 齐 ，Vol.19 No.1, 1978 年 

@ 在 招聘 网 站 Dice.com 上 检索 一 下 ，APL 语言 的 没落 程度 便 可 见 一 斑 。2013 年 
招聘 要 求 中 ， 提 到 APL 的 信息 仅 有 5 条 。 提 到 Java 语言 的 有 16295 条 ， 提 到 
Python 语言 的 有 3502 条 。 由 此 可 见 ， 使 用 APL 语言 的 人 已 经 很 少 了 。 

(3) 中 文 版 为 《C 程序 设计 语言 (第 2 版 。 新 版 )》 机 械 工业 出 版 社 于 2004 年 1 月 出 
版 ， 徐 宝 文 译 。 
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1.3 
小 结 


本 书 并 不 是 只 介绍 茶 一 特定 语言 ， 而 是 春 眼 于 学 习 具 有 普 这 适用 性 
的 知识 。 为 此 ， 我 们 使 用 “在 比较 中 学 习 ” 和 “在 历史 中 和 学习” 这 两 种 
方法 。 

“在 比较 中 学 习 ” 不 是 学 习 东 种 特定 语言 的 编程 ， 而 指 的 是 同时 比 
较 几 种 语言 ， 从 而 营 握 哪些 知识 是 因 语 言 不 同 而 不 同 的 ， 哪 些 知 识 是 几 
种 语言 共通 的 。 

“在 历史 中 和 学习” 指 的 是 探寻 语言 是 如 何 变 化 的 ， 以 及 在 发 生变 化 
前 存在 哪些 问题 ， 从 而 理解 语言 为 何 开 发 出 各 种 功能 。 
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程序 设计 语言 是 如 何 诞生 的 ? 
前 人 是 基于 什么 目的 发 明了 程序 设计 语言 ? 
本 章 我 们 来 回顾 一 下 程序 设计 语言 诞生 的 历史 。 


P| 
程序 设计 语言 诞生 的 历史 


在 第 1 章 中 我 们 讲 到 ， 通 过 比较 旧事 物 和 新 事物 可 以 加 深 理 解 。 其 
实 ， 了 解 旧 事物 还 有 另外 一 个 好 处 。 

很 多 事物 都 是 在 过 去 的 基础 上 ， 通 过 不 断 积累 创造 出 来 的 。 新 事物 
是 在 充分 了 解 了 旧事 物 的 基础 上 发 展 起 来 的 。 现 在 那些 看 似 理所当然 的 
事物 在 过 去 可 能 不 为 世人 所 知 。 因 此 ， 对 于 初学 者 来 说 ， 学 会 从 前 人 的 
视角 来 考虑 问题 ， 是 十 分 有 益 的 。 

那么 ， 我 们 赶紧 来 回顾 一 下 历史 吧 。 程 序 设 计 语 言 是 如 何 产生 的 
呢 ? 创造 程序 设计 语言 的 目的 是 什么 呢 ? 过 去 的 语言 和 现今 的 语言 有 何 
共通 点 呢 ? 

程序 设计 语言 的 产生 是 为 了 让 人 们 的 生活 、 工 作 更 加 便捷 。 为 了 说 
明 这 一 点 ， 我 们 先 来 看 一 下 程序 设计 语言 诞生 的 历史 ， 以 及 语言 设计 者 


的 设计 思想 。 


| 连接 电线 


大 约 半 世 纪 以 前 ， 程 序 设计 是 个 什么 概念 呢 ? 

1946 年 ， 世 界 上 第 一 台电 子 计算 机 一 一 ENIAC ( 埃 尼 阿 克 ，Electronic 
Numerical Integrator and Computer ) 问世 。 它 可 以 改变 计算 方式 ， 即 可 
以 更 改 程序 。 用 现在 的 话 来 讲 ， 它 是 一 台 可 编程 计算 机 。 但 是 其 编程 方 
法 和 如 今 大 家 熟知 的 程序 设计 大 相 径 诈 。 
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ENIAC 是 一 台 超 大 型 的 计算 机 ， 使 用 了 17 468 个 真空 管 ， 长 达 24 
米 。 试 想 一 下 ， we 
真空 管 的 机 械 装 是 怎样 的 一 幅 场景 ! 

We ey 十 电费 连 接 起 来 
(图 2.1 )。 每 次 更 改 程序 时 都 要 重新 调整 电缆 连接 方式 ， 实 在 费劲 。 有 
没有 方便 一 点 的 方式 呢 ? 


1 图 2.1 ENIAC 的 编程 场景 


※ U.S. Army Research Laboratory 


‖】 程序 内 四 


1949 年 ，EDSAC ( 爱 达 赛 克 ，Electronic ey Storage Automatic 
Calculator， 电 子 延迟 存储 自动 计算 机 ) 问世 。 这 是 一 种 通过 纸 市 打点 的 
方式 来 记录 和 读 取 数据 的 计算 机 (图 2.2 )。 程序 作 为 数据 通过 纸 市 输 
人 。 不 需要 重新 连接 电缆 ， 只 需要 让 计算 机 不 断 读 取 纸 这 上 的 数据 就 可 
以 更 改 程序 。 这 样 一 来 ， 程 序 的 更 改变 得 简单 易 行 。 
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和 图 2.2 纸 带 


IR rd 


※“Puchned tape”by TedColes. 2012 年 1 月 8 日 22 点 (日 本 时 间 ) 的 最 新 版 。http://en.wikipedia. 
org/wiki/File:PaperTapes-Sand8Hole.jpg 


但 是 人 们 要 读 懂 这 种 程序 绝 非 多 事 。 因 为 这 毕竟 只 是 一 种 供 机 需 
(计算 机 ) 阅读 的 语言 ， 即 机 需 语 言 。 在 输入 纸 带 上 ， 每 列 最 多 有 5 个 
孔 用 来 记录 数据 ， 其 他 的 小 孔 用 于 纸 带 传送 。 程 序 只 能 通过 这 5 个 孔 表 
现 出 来 。 


| FORTRAN 语言 问世 


直到 1954 年 ， 与 大 家 现在 使 用 的 语言 类 似 的 程序 设计 语言 才 被 发 
明 出 来 。 这 就 是 FORTRAN。” 它 的 全 称 是 Formula Translating System ( 公 
式 翻 译 系统 )。 现 在 ， 我 们 常用 Xx*Y+Z 来 表达 “X 乘 以 Y 再 加 Z。 最 
时 实现 这 一 点 的 就 是 FORTRAN。 将 公式 转化 为 机 需 语 言 是 FORTRAN 
语言 的 特点 之 一 。 

在 那个 年 代 ， 人 们 普遍 认为 只 有 用 机 器 语言 才能 写 出 高 效 的 程序 。” 


由 读者 如 有 兴趣 了 解 EDSAC 程序 和 它 的 执行 过 程 ， 可 以 到 笔者 设计 的 基于 浏览 器 
的 EDSAC 仿真 器 上 检验 一 下 。http:/nhiro.org/learn language/repos/EDSAC-on- 
browser/index.html 

这 并 不 是 说 FORTRAN 是 最 早 的 程序 设计 语言 。 哪 一 种 语言 最 早出 现 仍然 众说 纷 
颖 。 在 此 之 前 就 有 许多 种 语言 。 大 多 数 读者 脑海 中 的 程序 设计 语言 应 该 不 是 LISP 
语言 、FORTH 语言 ， 也 不 是 汇编 语言 吧 。 

(3) 参见 Ravi Sethi 的 著作 Programming Languages: Concepts and Constructs。 中 文 版 
为 《程序 设计 语言 : 概念 和 结构 ( 原 书 第 2 版 )》， 由 机 械 工业 出 版 社 于 2002 年 出 


- 忆 » EA 
版 ， 裘 宗 菩 等 译 。 
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实际 上 ， 使 用 FORTRAN 语言 编译 出 来 机 希 语 言 ， 与 一 个 熟练 的 程序 设 
计 者 直接 手写 机 融 语 言 相 比 ， 效 率 更 低 。 但 因 FORTRAN 语言 的 可 读 性 
强 且 代码 编写 量 大 大 减少 ， 它 还 是 俘获 了 众多 用 户 的 心 。 

1979 年 ， FORTRAN 的 设计 者 John Backus 说 道 : 我 的 大 部 分 成 果 
源 自 我 的 懒惰 ”“。 因 为 我 不 喜欢 写 程 序 , 所 以 我 设计 出 了 能 轻松 编写 程序 
的 系统 “。 


程序 设计 语言 产生 的 原因 


我 们 为 了 获得 更 轻松 便捷 的 体验 而 编写 程序 。 但 轻松 便捷 不 等 于 偷 
工 减 料 。 偷 工 减 料 在 前 ， 痛 百 在 后 ， 这 不 是 真正 的 便捷 。 


| 懒惰; 程序 员 的 三 大 美德 之 一 


大 家 上 听 说 过 “程序 员 的 三 大 美德 ” 吗 ? Perl 语言 的 设计 者 Larry 
Wall 在 其 著作 Programming Per 六 中 提出 ， 优 秀 的 程序 员 具 有 三 大 美德 ; 
懒 懈 、 急 踪 和 做 慢 ( Laziness, Inpatience and Hubris )。 这 就 是 俗称 的 程 
序 员 的 三 大 美德 。 本 节 ， 我 们 介绍 其 中 最 重要 的 一 项 素质 : 懒惰 。 


懒惰 ( Laziness ) 

懒惰 是 一 项 为 了 减少 总 能 量 支出 ， 而 不 遗 余力 地 努力 的 素质 。 
为 了 节省 工夫 ， 设 计 的 程序 逐渐 被 更 多 的 人 使 用 。 单 独 回答 每 个 使 
用 者 的 疑问 费时 费力 ， 于 是 ， 程 序 中 开始 标 有 注释 。 所 以 说 ， 懒 惰 


(D “Much of my work has come from being lazy，”http://www.msnbc.msn.comy/ 
1d/17704662/. 

© “Tdidn’t like writing programs,... I started work on a programming system to make it 
easier to write programs.” http://www.msnbc.msn.com/id/17704662/. 

@ 中 文 版 为 《Perl 语言 编程 (第 3 版 )》, 由 中 国电 力 出 版 社 于 2001 年 出 版 , 何 伟 平 译 。 

4) 美德 中 “急躁 ”的 意思 是 ,程序 员 忍受 不 了 程序 执行 的 低 效 。“ 傲 慢 ” 的 意思 是 ， 
程序 员 容 不 得 对 错误 不 管 不 顾 。 
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是 程序 员 最 宝贵 的 素质 。 也 正 因 如 此 ， 本 书 才 得 以 展现 在 各 位 面前 。 
请 参考 急躁 和 做 慢 的 解释 。 


《Perl 语言 编程 (第 3 版 )》 


Laziness 有 懒 懈 、 懒 散 、 慷 懒 等 不 同 的 翻译 方式 ， 总 的 来 说 就 是 让 
自己 轻松 、 方 便 。 但 这 不 是 追求 一 时 轻松 ， 而 是 选择 能 将 轻松 便捷 最 大 
化 的 方法 。 也 就 是 说 ， 在 能 达到 相同 目的 的 多 种 方法 中 ， 选 取 一 种 效率 
最 高 、 效 果 最 好 的 方法 。 

根据 《 Perl 语言 编程 (第 3 版 )》 一 书 ，Perl 这 一 名 字 是 来 目 Practical 
extraction and report language( 实用 的 数据 获取 及 展示 语言 )。 可 见 ，Perl 
是 为 了 能 方便 地 展示 数据 而 发 明 的 一 种 语言 。 


| 语言 们 各 有 各 的 便捷 


前 面 说 到 程序 设计 语言 是 为 寻求 便捷 而 创造 的 。 那 么 ， 为 什么 需要 
有 这 么 多 种 语言 呢 ? 这 是 因为 ,大 家 对 于 便捷 的 理解 因 人 而 异 。 我 们 来 
看 一 下 语言 设计 者 们 的 目的 以 及 他 们 是 以 何 为 便捷 的 吧 。 


目 何 为 “便捷 ” 

语言 则 在 使 什么 变 得 便捷 呢 ?” 是 高 速 的 代码 执行 ?还 是 简单 易于 
握 的 语言 规范 ? 抑或 是 轻松 地 理解 他 人 编写 的 代码 ? 

比如 ，C++ 是 一 种 非常 重视 代码 执行 速度 的 语言 。 为 了 使 编程 实 
现 相 同 目的 时 ， 执 行 速度 不 亚 于 C 语言 ，C++ 语言 的 规范 相应 变 得 复 
于 了。 

万 外 ，Scheme 是 一 种 很 重视 语言 规则 是 否 容 易 擎 握 的 编程 语言 。 
它 追 求 语 言 规范 最 简 原 则 ， 所 以 它 的 语言 规范 全 部 加 起 来 只 有 紧凑 的 
50 页 而 已 “。 但 是 , 对 满 是 括号 的 书写 方式 存在 抵抗 情绪 的 人 应 该 不 少 。 

Python 是 一 种 侧重 于 把 代码 阅读 变 得 容易 的 语言 。 相 对 于 Scheme 


性 


(D 准确 来 讲 ， 在 1998 年 第 五 版 修订 版 前 是 这 样 的 。 第 五 版 修订 版 是 50 页 ，2007 年 
的 第 六 版 放弃 了 规范 最 简 原 则 ， 增 加 到 187 页 。 然 而 ，C++ 语言 有 着 超过 1300 
页 的 规则 说 明 书 。 相 比 之 下 ，Scheme 语言 算是 非常 紧凑 的 了 。( 这 里 的 页 数 都 是 
指 日 文 版 页 数 。 译 者 注 ) 
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语言 ， 它 更 接近 于 C 语言 。 熟 练 的 编程 人 员 会 使 用 很 多 控制 语句 ， 并 且 
会 在 结构 层面 通过 缩 进 符 来 规范 书写 。 相 对 应 地 ， 其 速度 不 是 特别 快 ， 
语言 规则 也 不 那么 少 而 罕 凑 。 


目 各 有 各 的 便捷 

语言 的 便捷 之 处 各 不 相同 。 比 如 ， 用 PHP 语言 编写 Web 服务 很 轻 
松 ， 但 它 不 擅长 文字 人 处理。 相反 ，Haskell 和 OCaml 这 样 的 ML ( Meta- 
Language ) 系列 语言 ， 编 写 处 理 语言 文字 的 应 用 很 便捷 ， 但 编写 Web 服 
务 时 就 没有 PHP 使 用 得 那么 多 了 。 

在 不 同 语言 中 ， 既 有 便于 个 人 独立 实现 复杂 算法 的 语言 ， 也 有 便 
于 多 个 人 协作 实现 大 型 作业 的 语言 ， 还 有 便于 书写 一 次 性 使 用 的 测试 
类 语言 。 

程序 设计 语言 的 选用 因 使 用 者 目的 不 同 而 不 同 。 不 同 语言 致力 于 达 
成 不 同 的 目的 。 如 采 把 为 实现 高 速 执 行 而 设计 的 C++ 语言 和 为 了 便于 代 
码 阅 读 而 设计 的 Python 语言 放 到 一 起 比较 ， 说 C++ 语言 的 可 谈 性 差 或 
者 Python 的 执行 速度 慢 ， 这 样 的 争论 意义 并 不 是 很 大 。 


Za. 
小 结 


如 前 所 述 ， 程 序 设 计 语 言 是 为 了 给 人 们 球 来 便捷 。 但 是 何 为 便捷 ， 
语言 不 同 ， 便 捷 的 含义 也 各 不 相同 。 

语言 只 是 工具 。 某 种 十 言 是 否 适合 目 己 ， 要 看 使 用 这 种 语言 能 玫 助 
目 己 发 挥 多 大 的 能 力 ， 而 不 是 看 这 种 语言 是 否 流行 ， 别 人 使 用 它 发 挥 了 
多 大 能 力 。 再 进一步 讲 ， 要 看 通过 使 用 它 目 己 能 做 出 多 大 成 果 。 大 家 不 
要 为 他 人 的 言语 所 惑 ， 应 当 根 据 目 己 的 实际 情况 选择 好 的 工具 。 
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程序 设计 语言 有 许多 的 规则 。 
为 什么 有 这 么 多 的 规则 呢 ? 
本 章 通过 比较 规则 较 少 的 语言 ， 来 揭示 规则 是 如 何 产生 的 。 


了 .7 
什么 是 语法 


程序 设计 语言 中 有 各 种 各 样 的 规则 。 比 如 ， 乘 法 运算 比 加 法 运算 优 
先 级 高 ， 所 以 1+2*3 这 样 书写 的 算式 是 先 计 算 2*3 的 。 语 法 就 是 程序 语 
言 设 计 者 规定 的 解释 程序 编写 方式 的 一 系列 规则 。 在 第 2 章 中 ， 我 们 讲 
到 程序 设计 语言 是 为 了 带 来 便捷 而 创造 的 ， 那 么 语法 又 会 是 为 何 而 创造 
出 来 的 呢 ”? 

本 章 我 们 来 讨论 乘法 运算 和 加 法 运算 的 规则 。 当 今 主流 的 算式 表达 
方法 很 复杂 ， 我 们 来 讲解 一 下 简单 一 些 的 FORTH 语言 和 LISP 语言 。 
FORTH 语言 基本 上 是 没有 语法 的 ， 而 LISP 语言 通过 括号 来 表现 代码 的 
结构 。FORTH 语言 和 LISP 语言 所 具有 的 功能 是 当今 程序 设计 语言 重要 
的 组 成 部 分 。 


| 运算 符 的 优先 顺序 

大 家 使 用 的 语言 ， 肯 定 可 以 表达 像 1+2*3 这 样 的 加 法 和 乘法 运算 。 
运算 符 指 的 就 是 加 法 运算 里 的 + 号 和 乘法 运算 里 的 * 号。 

然而 ，1+2x3 这 样 的 源 代 码 ， 先 是 1 加 2 再 把 结果 与 3 相 乘 即 


四 语法 和 向 法 有 什么 差别 呢 ? 也许 有 人 要 问 这 个 问题 。 两 者 都 是 编写 程序 时 要 遵循 
的 规则 ， 只 是 句法 的 含义 仅 限于 较 小 的 范围 。 比 如 ， 称 这 语句 为 句法 是 很 自然 的 ， 
但 称 运算 符 的 优先 顺序 为 句法 就 很 不 自然 了 。 第 4 章 还 会 讨论 诸如 站 语句 、for 
语句 这 样 的 控制 名 法， 所 以 本 章 只 使 用 语法 一 词 。 
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(1+2)*3 呢 ， 还 是 先 2 乘 3 再 把 结果 与 1 相 加 即 1+(2*3) 呢 ? 这 个 顺序 
是 怎么 规定 的 呢 ? 

答案 是 怎么 方便 就 怎么 规定 。 比 如 ， 以 前 有 些 计 算 器 计算 1+2*3 的 
结 采 有 可 能 是 9， 也 就 是 执行 的 (1+2)*3。 而 现在 大 家 使 用 的 程序 设计 语 
言 大 多 数 的 计算 结果 都 应 该 是 7。 这 是 因为 程序 语言 设计 者 制定 了 乘法 
优先 级 高 于 加 法 先行 计算 这 一 规则 。 考 虑 到 这 和 四 则 运算 的 法 则 是 一 致 
的 ， 大 家 理解 起 来 一 点 也 不 费劲 。 

那么 ， 对 于 除法 运算 9/3/3， 是 9/(3/3) 呢 ， 还 是 (9/3)/3 ? 这 又 是 如 
何 规定 的 呢 ? 大 部 分 的 语言 中 都 是 按照 (9/3)/3 来 计算 。 这 是 因为 程序 
语言 设计 者 制定 了 这 样 的 规则 : 在 左 结合 运算 符 除 号 出 现 并 列 的 情况 下 ， 
运算 从 左 开 始 计算 。 


‖ 语法 是 语言 设计 者 制定 的 规则 


语言 设计 者 制定 的 规则 就 是 语法 。 语 法 因 话 言 而 异 。 运 算 符 的 存在 
类 型 也 因 语 言 而 异 。 比 如 C 语言 中 的 赋值 符 = 是 运算 符 。 但 它 与 普通 的 
加 减 乘 除 运 算 符 不 同 ， 是 右 结 合 运算 符 。 所 以 源 代 人 码 中 X = Y = 1 这 
样 的 语句 ， 被 解释 为 X=(Y=1) 。 


栈 机 器 和 FORTH 语言 


FORTH 语言 开发 于 1958 年 左右 ”， 是 一 种 几乎 没有 语法 的 语言 。 


其 设计 者 Charles H. Moore 说 FORTH 是 最 简单 的 计算 机 语言 >。 他 


山 与 这 不 同 的 是 ，Python 语言 中 的 赋值 符 = 不 是 运算 符 而 是 一 种 句 式 ， 在 运算 式 中 
不 能 出 现 。 

(2 于 1969 年 发 布 。 

@ 《言语 设计 者 大 力作 考 之 已 二 上 》Federico Biancuzzi、Shane Warden 编 /伊藤 真 浩 、 
项 末 和 义 、 估 蕨 嘉 一 、 铃 木 幸 敏 、 村 上 雅 章 译 ，0O "Reilly Japan，2010 年 ，p.66。 
中 文 版 为 《编程 之 魂 : 与 27 位 编程 语言 创始 人 对 话 》 电子 工业 出 版 社 于 2010 年 
4 月 出 版 ， 头 怀 志 译 。 
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认为 ， 世 上 所 有 的 程序 设计 语言 都 具备 一 定 的 可 读 性 ， 但 初次 接触 某 种 
语言 的 人 常常 感到 困惑 ， 这 是 由 于 它们 的 语法 往往 星 梁 难 懂 且 变化 多 
端 。 而 FORTH 语言 将 语法 控制 到 最 少 的 程度 缓和 了 这 一 问题 "。 

我 们 试 着 讲 一 下 FORTH 这 门 语言 ， 看 一 下 它 和 现在 的 语言 有 什么 
不 同 。 


| 计算 的 流程 

那么 号 称 语 法 最 少 的 FORTH 语言 是 如 何 编 瑟 代码 的 呢 ? FORTH 
语言 中 ，1 加 2 是 这 样 书写 的 : 
2 于 

我 们 来 看 一 下 这 行 代码 是 如 何 执行 的 。 作 为 其 一 大 特点 ，FORTH 
语言 使 用 了 被 称 为 栈 的 数值 预存 空间 ， 如 图 3.1 上 方 开 口 的 格子 所 示 。 
代码 从 头 开 始 执行 ， 处 理 器 首先 遇 到 的 是 数值 1, 于 是 在 栈 中 放 1。 然 后 
遇 到 数值 2， 再 次 把 2 存 进 栈 。 最 后 遇 到 + 号 。 这 个 符号 被 定义 的 功能 
是 ， 从 栈 中 取出 前 面 两 个 数值 ， 再 把 其 相 加 的 结果 存 入 栈 。 于 是 ， 从 栈 
中 把 1 和 2 取出 来 ， 加 法 运算 后 的 结果 3 被 放 入 栈 中 。 


1 图 3.1 利用 栈 的 运算 逻辑 
一 [3 


| 如 何 表达 计算 顺序 


这 种 语言 是 如 何 区 别 1 加 2 再 与 3 相 乘 即 (1+2)*3 和 2 乘 以 3 再 与 
1 相 加 即 1+(2*3) 这 两 种 计算 的 呢 ? 


凡人 7 人 
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1 加 2 再 乘 以 3 可 以 表达 为 : ” 
2 乘 3 再 加 1 可 以 表达 为 : 


基本 上 与 日 语 中 的 语序 是 一 致 的 ”。 如 果 1、2、3 的 顺序 很 重要 的 
话 ， 也 可 以 进行 如 下 表达 : 


1 20 人 


即 1 和 2 乘 以 3 的 结果 相 加 。 在 FORTH 语言 中 不 需要 括号 也 不 需 
要 导入 优先 次 序 的 规则 就 可 以 表达 计算 顺序 。 


i 现在 仍然 使 用 的 栈 机 器 


如 今 ， 估 计 大 家 很 少 再 用 FORTH 这 种 基于 栈 的 语言 直接 编写 代码 了 。 
但 是 在 一 些 不 常见 的 场合 仍然 会 看 到 它 的 刁 影 。 比 如 ，Java、Python.、 
Ruby 1.9 这 些 语言 使 用 了 栈 机 器 型 的 VM。VM 执行 的 命令 行 和 FORTH 
语言 是 一 样 的 。 用 Python、Ruby 或 Java 等 语言 写 出 来 的 程序 ， 在 机 需 内 
部 先 被 转换 ( 编译 ) 成 像 FORTH 语言 一 样 的 程序 ， 然 后 再 运行 。 

我 们 用 Python 语言 实际 执行 看 一 下 。 通 过 Python 语言 自 带 的 库 文 
件 dis， 我 们 可 以 显示 VM 执行 的 命令 行 ”。 


Python 

> moe es 

> os os enmloean 2 
0 LOAD FAST 0 (x) @ 


Q) 希望 实际 执行 一 下 FORTH 语言 的 读者 可 以 到 笔者 制作 的 网 页 上 尝试 一 下 : 
http://nhiro.org/learn language/FORTH-on-browser.html 

@@ 上 日语 中 以 上 两 个 算式 的 表达 分 别 是 :1 上 2 去 足 L 大 (+) 由 0 人 民 3 去 持 付 吾 (Cx) 
2 上 3 去 持 付 大 (Cx) 由 0 民工 在 足 才 (+)。 相 关 数 值 和 运算 符 在 日 语 语句 中 出 现 的 
次 序 与 表达 式 是 一 致 的 。 译 者 注 

B83) 行 末 编号 是 笔者 加 上 去 的 。 
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3 LOAD FAST iT 
6 BINARY ADD 
7 LOAD FAST 2 1z) 


OOOO 


10 BINARY MULTIPLY 
IPRETURNYVALUE 


(X+Y)*X 这 行 代 码 ， 被 依次 编译 为 命令 行 : 各 将 X 压 入 栈 一 四 将 
Y 压 入 栈 一 全 把 栈 上 两 数 相 加 一 @ 将 久 压 入 栈 一 昌 把 栈 上 两 数 相 乘 。 
这 和 FORTH 一 样 ， 是 按 XY+Zx* 的 顺序 排列 的 。 


3.3 


语法 树 和 LISP 语言 


前 文 讲 到 ，FORTH 语言 不 需要 使 用 括号 或 者 优先 次 序 束 可 以 表达 
计算 顺序 。 现 实 中 ， 有 的 语言 总 是 需要 用 括号 标示 完整 的 意思 单元 ， 比 
如 1958 年 诞生 的 LISP 语言 。 


| 计算 流 
LISP 中 1 加 2 用 代码 表达 如 下 : ” 


(EE 2 


首先 是 一 个 括号 ， 接 着 是 加 号 命令 ， 用 空格 分 阳 后 ， 跟 上 进行 相 加 


| 如 何 表 达 计算 顺序 


我 们 来 看 如 何 用 代码 表达 1 与 2 相 加 的 结果 与 3 相 乘 。 把 | 相 乘 、 
(什么 入 3] 中 的 (什么 ) 换 成 《 相 加 、1、2 ), 我 们 得 到 : 


JW 希望 实际 执行 一 下 LISP 语言 的 读者 可 以 到 笔者 制作 的 网 页 上 尝试 一 下 : http:// 


nhiro.org/learn language/LISP-on-browser.html, 
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文 个 过 程 如 图 3.2 所 示 。 和 @@ 为 (1 与 2 相 加 ), 在 LISP 语 言 中 ， 代 
码 表示 为 (+ 1 2 )。 图 3.2 把 命令 放 在 上 方 ， 把 (什么 ) 这 部 分 放 在 下 
方 。 @ 为 | (什么 ) 与 3 相 乘 (什么 ) 这 部 分 用 ? 表示 。 鼻 为 把 (1 与 
2 相 加 ) 代入 (什么 ) 这 部 分 的 结果 。 图 3.2 这 样 的 结构 称 为 语法 树 。 


1 图 3.2 语法 树 的 结构 图 3.2 语 吾 法 树 的 结 


“Q 


OW 忆 4 


我 们 把 这 个 语法 树 和 FORTH 语言 和 LISP 语言 的 代码 放 在 一 起 比较 
下 


和 图 3.3 FORTH 和 LISP 的 语法 树 是 相同 的 


12+3* (ww (F123) 


可 以 看 出 ， 对 于 这 两 种 语法 简单 的 语言 ， 它 们 只 是 在 这 个 语法 树 上 
按 不 同 的 规则 遍历 而 已 。 两 者 的 代码 看 起 来 差别 很 大 ,但 实际 上 所 用 的 
树 结 构 是 相同 的 。 


i 现在 仍然 使 用 的 语法 树 


当今 的 语言 仍然 在 使 用 语法 树 。 我 们 用 Python 语言 实际 执行 一 下 。 
通过 Python 语言 自 带 的 库 文 件 ast， 我 们 可 以 查看 特定 的 代码 被 转换 成 
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怎样 的 语法 树 ”。 


Python 
>>> import ast 
>>> ast.dump (ast.parse("1 + 2")) 
Moaule 
ea 三 EL 
value=BinOp ( 

left=Num (n=1), 

op=Add () ， 

rsetenlale Nm 2 


>>> ast.dump(ast.parse("(1 + 2) * 3")) 
Module 
15GGI7E Lado ( 


value=BinOp ( 

left=BinOp ( 
left=Num (n=1), 
op=Add () ， 
alkene Nom 2 

J 

op=Mult () ， 

stenlale Nm 三 马 》) 


我 们 将 其 下 。Python 语言 这 边 看 起 来 更 为 铺 综 复 杂 ， 
但 我 们 还 是 能 察 党 到 两 者 有 者 共通 的 结构 。 图 3.4 中 BinOp op =Mult( ) 
表示 乘法 运算 ， 与 LISP 的 * 相对 应 ; BinOp op =Add( ) 表示 加 法 运算 ， 
与 LISP 的 + 相对 应 。Num n=1 即 为 数值 1， 这 与 LISP 的 1 相对 应 。 


(DD ast 是 abstract syntax tree 的 简写 ， 意 为 抽象 语法 树 。 在 语法 复杂 的 语言 溢 污 
树 是 包含 很 多 细节 的 语法 结构 表达 形式 。 把 这 种 形式 以 更 简洁 的 形 趟 表达 出 来 就 
是 抽象 语法 树 。 
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和 图 3.4 ”Python 语言 与 LISP 语言 的 语法 树 比较 


Python [LISP 
>>> ast.dumpl(ast.parse("(1 + 2) * 3") 
Module( 
body=[Expr  Ls]l 


Value=Binop( ES 
1 left=BinOp( | 从 
; ! left=Num(n=1),， | | | 
! ! 0p=Add()， | !! : : 


! 1 right=Num(n=2) : ' > a | (3) 
| | 
! op=Mult(), : 1 

| 1 串 Nu : | 


要 确认 理解 是 否 正确 ， 首 先 得 表达 出 来 


假设 你 正在 学 习 一 些 知 识 ， 并 自我 感 锅 已 经 理解 了 。 那 么 ， 你 到 话 是 真 
正 理 解 了 呢 ， 还 是 感觉 自己 已 经 理解 了 呢 ? 这 个 仪 插 自己 苦 思 冥想 是 不 行 
的 。 为 了 验证 理解 正确 与 否 ， 需 要 表达 出 来 。 只 能 基于 自己 的 理解 说 出 自己 
的 观点 ， 然 后 让 第 三 方 来 判断 和 检验 。 比 如 学 习 英 语 ， 融 要 在 别人 面前 使 用 
自己 学 到 的 英语 ， 同 时 观察 别人 的 反应 。 不 这 样 做 的 话 ， 融 无 法 知道 自己 是 
否 真正 掌握 了 英语 。 

程序 员 一 直 受 益 于 这 一 点 。 如 果 是 写 文 草 ， 写 出 来 的 东西 即使 有 错误 也 
可 能 没 人 指出 来 ， 或 者 根本 没有 人 看 你 的 东西 。 但 是 写 程序 不 一 样 ， 语 言 处 
理 器 会 事 无 己 细 地 做 错误 检查 并 指出 。 这 和 与 人 打交道 不 同 ， 只 要 你 方便 ， 
它 总 是 有 足够 的 时 间 和 耐心 障 你 一 起 。 

一 县 出现 程 序 错误 ， 很 多 人 可 能 会 惊 屋 失 措 。 其 实 那 只 是 语言 处 理 器 在 
仔细 阅读 了 你 的 程序 后 ， 告 诉 你 它 哪里 不 明日 而 已 。 只 有 理解 了 这 一 点 ， 才 
能 和 语言 处 理 磺 打交道 。 


LISP 语言 语法 人 简单， 代码 与 语法 树 容易 理解 并 且 对 应 比较 直观 。 此 
外 ， 它 还 具有 宏 这 样 的 语法 树 殖 换 机 制 。 这 两 个 特点 催生 了 程序 设计 二 言 
进化 路 上 发 生 的 结构 化 编程 等 一 系列 现象 。 详 细 内 容 我 们 将 在 第 4 草 讲 解 。 
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3.4 
中 缀 表达 式 


在 FORTH 语言 中 ， 我 们 用 1 2 + 来 表达 1 加 2， 运 算 符 放 在 运算 对 
象 的 后 面 。 在 LISP 语言 中 ，1 加 2 表达 为 (4+ 1 2)， 运 算 符 放 在 运算 对 象 
的 前 面 。 而 数学 表达 式 中 用 1+2 来 表达 ， 运 算 符 放 在 运算 对 象 的 中 间 。 
像 这 样 把 运算 符 放 在 运算 对 象 之 后 、 之 前 和 之 中 的 表示 法 分 别称 为 后 绥 
表达 式 、 前 绥 表 达 式 、 中 缀 表达 式 "。 

这 三 种 表达 式 只 是 表达 方法 上 的 约定 事项 而 已 。 在 程序 设计 语言 出 
现 以 前 ， 人 们 仅 习 惯 于 用 中 绥 表 达 式 来 书写 数学 表达 式 。 

FORTRAN 语言 就 是 旨 在 用 已 经 习惯 了 的 方式 编写 程序 。 这 就 是 为 
什么 FORTRAN 语言 的 全 称 为 Formula Translating System ( 表达 式 翻 译 
系统 ) FORTRAN 语言 导入 了 运算 符 优先 级 和 结合 性 等 复杂 的 语法 ,但 
程序 员 可 以 用 习惯 的 方式 来 编写 数学 表达 式 。 


| 语法 分 析 器 


语法 分 析 需 是 把 源 代 码 作 为 字符 串 读 入、 解析 ， 并 建立 语法 树 的 程 
序 。FORTRAN 语言 在 编译 程序 时 ， 语 法 分 析 器 会 将 源 代 码 的 字符 串 转 
换 为 语法 树 。 

语法 的 设计 和 语法 分 析 器 的 实现 是 决定 语言 外 在 表现 的 重要 因素 。 
语言 设计 者 在 设计 语法 时 ， 会 考虑 使 哪些 部 分 变 得 编写 简便 ， 哪 些 变 得 
不 容易 出 错 ， 哪 些 能 给 用 户 带 来 价值 等 问题 。 

但 是 ， 从 这 些 角 度 出 发 设计 的 语法 在 语法 分 析 絮 中 能 否 实现 却 是 另 
一 个 问题 。 语 法 的 解析 方法 不 同 ， 实 现 清晰 明确 的 解析 的 规则 也 不 同 。 


(D 前 组 表达 式 和 后 级 表达 式 也 被 称 为 波兰 表示 法 和 北 波 兰 表示 法 ， 得 名 于 最 先 研 究 
它们 的 波兰 人 Jan Lukasiewicz。 前 级 表达 式 中 的 括号 并 不 是 必需 的 ， 因 为 只 要 知 
道 二 和 * 取 的 是 两 个 运算 对 人 象 ， 即 使 省 略 了 括号 ， 表 达 式 * 十 1 2 3 的 含义 也 是 可 
以 理解 的 。LISP 语言 中 ， 有 三 个 以 上 运算 对 象 的 情况 也 可 以 写成 (+ 1234)。 因 
为 有 了 括号 不 会 导致 误解 ， 省 略 括号 是 不 行 的 。 
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此 外 ， 在 现 有 的 语言 中 引入 新 的 功能 时 ， 有 可 能 因为 和 既 有 的 规则 发 生 
冲突 而 产生 问题 。 


| 规则 的 竞争 


在 C++ 语言 中 增加 模块 功能 时 ， 引 入 了 vector<int> 这 样 用 不 等 号 
括 起 来 的 表达 方法 。 这 种 方法 在 二 香 表 达 时 ， 一 侧 的 符号 >> 就 会 被 解 
析 为 既 有 的 移 位 运算 符 >>。 语 法 分 析 器 要 解决 这 个 问题 并 不 容易 ， 所 
以 程序 员 通 过 增加 空白 符 的 方法 来 避免 其 变 成 移 位 运算 符 。 


专栏 
当 你 不 知道 该 学 习 什么 时 


应 该 学 习 什么 ? 我 们 经 常 听 到 这 样 的 问题 。 在 回答 之 前 ， 笔 者 想 先 问 这 
样 一 个 问题 : 你 学 习 的 目的 是 什么 ?” 这 个 如 果 不 明 确 ， 提 建议 就 无 从 下 手 。 

我 们 生活 在 一 个 信息 爆炸 的 时 代 。 不 管 三 七 二 十 一 统统 都 学 ， 这 样 的 学 
习 策 略 已 经 不 再 适用 。 必 然 要 有 所 学 ， 有 所 不 学 。 这 时 ， 我 们 就 要 事先 明确 
自己 到 底 想 做 什么 ， 然 后 再 去 学 习 能 够 达成 这 一 目标 的 知识 。 

不 知道 自己 要 做 什么 ? 或 许 你 从 一 开始 就 在 苦 思 ， 想 做 一 件 完 美的 事 
青 。 一 件 从 没有 人 想到 过 的 ， 生 Ci 赞誉 的 事情 。 如 果 最 初 的 设想 太 过 
宏大 导致 无 从 下 手 ， 那 么 这 一 i ee 

Was 你 可 以 逐渐 明白 自己 哪些 已 经 能 做 、 
ss ne ee 
杂 的 任务 的 能 力 。 


人 十 


Ho 


vector<vector<int> > XxX: 


ZNG 
vector<vector<int>> y; 

当然 ， 理 想 的 情况 是 把 语法 分 析 器 改良 到 能 同时 照顾 好 两 方 又 不 出 
错 的 程度 。 然 而 现实 与 理想 总 是 有 差距 的 。 由 既 有 规则 的 著 绊 导致 不 目 
然 的 规则 产生 ， 这 种 现象 不 仅 限 于 C++ 语言 ， 在 其 他 语言 中 同样 存在 。 
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3.9 
小 结 


同样 是 处 理 1 加 2 乘 以 3 这样 的 运算 ， 不 同 语言 的 表达 方式 大 相 径 
庭 。 但 是 基本 上 都 是 用 语法 树 来 表达 。 语 言 之 间 的 这 种 差异 就 是 语法 的 
差别 ， 它 决定 了 怎样 的 代码 对 应 怎样 的 语法 树 。 

FORTH 语言 和 LISP 语言 尽量 精简 规则 。 但 是 市 场 追 求 的 不 是 规则 
数量 多 么 少 、 多 么 简单 。 相 比 之 下 ，FORTRAN 语言 大 量 导 和 人 了 诸如 乘 
法 运算 符 优先 级 高 于 加 法 这 样 的 决定 性 规则 ， 重 视 编写 的 便利 性 。 这 种 
设计 理念 大 获 成 功 ， 与 LISP 语言 和 FORTH 语言 相 比 ，FORTRAN 语言 
的 风格 为 更 多 的 人 所 接受 。 

大 家 在 编写 程序 时 ， 是 不 是 时 常 抱怨 为 什么 有 这 么 别扭 复杂 的 编写 
规则 ? 现代 的 大 多 数 语 言 都 崇尚 FORTRAN 语言 风格 ， 追 求 简 单 便利 的 
编写 规则 。 然 而 ， 设 计 不 存在 任何 解析 矛盾 的 语法 体系 是 十 分 困难 的 。 
随后 要 再 融入 新 的 语法 时 不 与 既 有 的 语法 发 生 冲 突 ， 这 个 尤其 困难 。 正 
因为 如 此 ， 现 实 中 程序 设计 语言 仍然 保留 有 不 少 别 扭 复杂 的 编写 规则 。 
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4.2 ”if 语句 诞生 以 前 


if 语句 更 简洁 


4.3 ”while 语 和 


渐 增 的 while 语句 更 简洁 


4.4 ”for 语 外 
4.5 小 结 


28 


28 


33 


35 


37 


第 人 章 


程序 的 流 至 而 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


28 | 第 4 章 程序 的 流程 控制 


程序 设计 语言 中 有 if、while、for 等 用 来 控制 程序 流程 的 语句 。 
为 什么 会 有 这 些 控制 语句 呢 ? 

本 章 我 们 将 通过 比较 没有 控制 语句 的 汇编 语言 和 带 有 控制 语句 的 C 
语言 ， 来 探讨 控制 语句 是 如 何 产生 的 。 


结构 化 程序 设计 的 诞生 


从 第 3 章 我 们 了 解 到 ， 为 了 能 使 用 更 加 月 然 的 表达 方式 来 书写 算式 ， 


程序 设计 中 引入 了 乘法 运算 优先 级 高 于 加 法 运算 这 样 的 规则 ( 语法 )。 

20 世纪 60 年 代 后 期 ， 在 提倡 规则 让 读 写 程序 更 轻松 的 时 代 潮 流 中 ， 
结构 化 程序 设计 应 运 而 生 。 时 至 今日 ， 大 家 对 让、while 这 样 的 语句 早已 
习 已 为 常 。 结 构 化 程序 设计 的 初衷 正 是 通过 导入 这 些 语句 使 代码 结构 的 
理解 变 得 简单 。 

虽说 这 些 语句 的 导入 是 为 了 使 代码 结构 更 简单 ， 但 现在 大 家 都 觉得 
这 是 理所当然 的 事 ， 也 许 一 下 子 也 觉察 不 到 它 带 来 的 变化 了 。 那 么 ， 我 
们 拿 它 和 不 使 用 站 或 while 语句 的 代码 比较 一 下 吧 。 


4.2 
省 语句 诞生 以 前 


如 果 没 有 过 语句 该 如 何 编 写 程序 呢 ? 我 们 首先 来 考察 一 下 这 一 问题 。 


| 为 什么 会 有 if 语 句 


本 章 我 们 使 用 一 种 非常 原始 的 程序 设计 语言 一 一 汇编 语言 。 汇 编 十 
言 中 是 没有 这 语句 的 ， 但 是 从 C 语言 很 容易 束 能 编译 成 汇编 语言 。 接 下 
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来 ， 我 们 用 C 语言 先 编写 带 站 语句 的 代码 ， 再 试 着 将 其 编译 成 汇编 语言 
站 二 下 。 

C 语言 下 的 源 代 码 如 下 所 示 ， 其 含义 是 如 果 X 等 于 456 则 做 相应 
处 理 2。 


| 


Lit ww 三 123; 

7 

if (x == 456) { 
/* if 语句 中 */ 

} 

/wx 语句 局 */ 


编 详 后 输出 如 下 汇编 语言 代码 。 


汇编 语言 


movl S123, =B(%oa) 0 

HE eA 

movl -8 (Srbp), ,© 

cmpl $456, S$%Seax 

jne LBB1 > © 

PE © 
LBB1 2: © 


# if 语 句 后 
我 们 试 着 来 解读 一 下 : 首先 ， 把 -8(%rbp) 理解 为 原来 代码 中 的 x。 
全 各 把 数值 123 代入 x， 和 四 人 句 将 x 的 值 移 存 到 临时 场所 后 ， 把 它 和 数值 
456 相 比 较 。 


Q) 通过 编译 转换 成 汇编 语言 ， 然 后 汇编 到 机 器 语言 ， 最 后 链接 成 一 个 可 执行 文件 ， 
现在 一 般 把 这 一 整 囊 的 动作 统称 为 编译 。 这 里 说 的 编译 仅 指 转 换 成 汇编 语言 这 一 
个 步骤 。 

@ 实际 实验 的 代码 里 ， 通 过 使 用 asm 在 汇编 语言 里 误 入 了 注释 。 这 里 为 了 简洁 
罗 读 做 了 改写 。 请 参照 本 书 文 前 的 “本 书 构成 ”部 分 获取 可 执行 的 源 代码 。 
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接 下 来 的 自 句 是 关键 ， 它 表示 在 前 一 句 的 比较 中 ， 如 果 两 边 不 相等 
则 跳 转 至 LBB1 2 处 。 换 句 话 说， 如 果 两 边 相 等 则 不 跳 转 接着 执行 下 面 
的 命令 。 和 四 名 就 是 放 语 句 中 的 代码 ， 它 只 在 两 边 相 等 时 被 执行 。 不 相等 
时 程序 跳 转 至 LBB1_2 ( 即 加 句 处 )，@ 句 不 被 执行 ”。 

这 种 满足 条 件 后 跳 转 的 命令 很 早 就 有 。 比 如 1949 年 发 明 的 EDSAC 就 
有 “特定 内 存 值 大 于 零 时 跳 转 ”和 “特定 内 存 值 为 负 时 跳 转 ”这 两 条 命令 “。 


| 为 什么 会 有 if...else 语句 


大 家 在 学 习 站 语 句 时 ， 想 必 同 时 也 把 else 和 else 让 语句 配套 地 学 习 
了 吧 %” 没有 else 和 else if 程 序 就 没 法 写 了 吗 ? 非 也 ! 本 节 我 们 来 看 一 下 
同样 没有 else 和 else if 语 句 的 汇编 语言 。 


和 汇编 语言 中 的 表达 方式 
我 们 先 在 C 语言 中 实现 else 语句 ， 然 后 把 它 编译 成 汇编 语言 。 这 是 
一 段 处 理 x 值 为 正 为 负 或 为 零 时 的 代码 。 


Cc 语 言 5 
/* ifE 语 句 前 */ 
(SS | 
/* 为 正 时 的 处 理 */ 
else if(x <0)7 
/* 为 负 时 的 处 理 */ 
}else{ 
/* 为 零 时 的 处 理 */ 
} 
VT 


与 前 面 一 样 ， 这 段 代 人 码 编译 后 结果 如 下 。 


(DD 这 几 个 命令 的 意思 分 别 是 : movel=move long integer，cmpl=compare long integer， 
jne=jump if not equal。 

@) 准确 来 讲 ， 不 是 内 存 而 是 累加 器 (accumulator )。 本 书 把 内 存 一 词 理 解 为 记忆 装置 
并 用 在 会 书 中 。 

@) C 语 言 中 ，else if 不 是 独立 的 语句 ， 而 是 else 后 紧 跟着 的 证 语句 。 这 个 表达 在 各 
种 语言 中 不 尽 相 同 ，Perl 语言 和 Ruby 语言 中 有 elsif，Sh 语言 和 了 Python 语言 中 有 
elif 这 样 专门 的 关键 字 。 
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# if 语 句 前 


movil -8(%$rbp), $eax 
cmpl $0, %Seax 
We LBB1 2 » 
# 为 正 时 的 处 理 ” @ 
jmp LBB1 5 © 
EB 4 
movil -8(%$rbp), $eax 
cmpl $0, %Seax 
jge LBB1 4 © 
# 为 负 时 的 处 理 ”@ 
jmp LBB1 5 ©@ 
LBB1 4: © 
# 为 零 时 的 处 理 “各 
LBB1 5: @ Fo 


# iE£ 语 句 后 


我 们 按 顺 序 来 读 一 下 : 人 @ 句 指 如 果 x 小 于 或 等 于 0 时 跳 转 至 
LBB1 2( 和 @@ 句 )， 四 句 是 为 正 的 处 理 ， 自 句 跳 转 至 LBB1 5 ( @@ 人 种 )。 接 
着 ， 句 指 x 大 于 或 等 于 0 时 跳 转 至 LBB1 4 (和 名 )，@@ 句 是 为 负 的 处 
理 ，@ 句 跳 转 至 LBB1 5 (@ 句 )。 最后， 人 @ 句 是 为 零 的 处 理 。 

那么 ， 就 实际 中 x 为 正 ，x 为 负 ，x 为 零 的 情况 ， 我 们 来 追踪 下 程 
序 是 如 何 执行 的 。 

为 正 时 ， 和 加 名 的 “小 于 等 于 零 则 跳 转 ”不 成 立 ， 因 此 不 跳 转 而 继续 
执行 @ 人 句 中 为 正 时 的 处 理 ， 然 后 执行 @ 人 名 中 跳 转 至 @ 句 ， 程 序 结 

为 负 时 ， 和 名 的 “小 于 等 于 零 则 跳 转 ”成 立 ， 跳 转 至 @@ 句 ， 避 句 的 
大 于 等 于 零 跳 转 不 成 立 ， 故 不 跳 转 而 继续 执行 @ 句 中 为 负 时 的 处 理 ， 然 
后 执行 @ 句 中 的 跳 转 至 人 @ 句 ， 程 序 结 

为 去 时 ， 和 名 的 “小 于 等 于 零 则 跳 转 ”成 立 ， 跳 转 至 @@ 句 ， 避 句 的 


(D jle 是 jump if less or equal 的 略称 ， 实 现 小 于 等 于 零 时 的 跳 转 。Jge 与 之 相反 ， 是 
jump if greater or equal 的 略称 。jmp 是 jump 的 略称 ， 表 示 无 条 件 跳 转 。 
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“大 于 等 于 零 跳 转 ” 成 立 ， 故 跳 转 至 @@ 句 ， 在 自 句 执行 为 零 时 的 处 理 。 
由 上 可 见 ， 本 来 要 表达 如 末 等 于 某 值 则 执行 某 事 的 逻辑 的 ， 却 不 得 
不 表达 为 如 果 不 等 于 某 值 则 跳 转 至 某 处 执行 某 事 。 如 此 这 般 条 件 颠 倒 ， 
看 起 来 实在 是 有 些 混乱 ”。 
外 C 语 言 中 的 表达 万 式 
这 种 不 使 用 else 语句 的 书写 方式 在 C 语言 中 不 可 能 实现 吗 ? 不 是 
的 。C 语言 中 ， 如 果 使 用 跳 转 至 指定 行 的 命令 goto 语句 的 话 ， 这 个 一 样 
可 以 实现 。 实 验 中 的 实现 代码 如 下 所 示 。goto END; 语句 意 指 跳 转 至 标 
示 有 END: 的 一 行 。 
ge 


vold moe Useoif(ine | 


i 下 (到 有 = 0) GoEG RO OS 
BEE 

goto END; 
NO OS 

(0 Go NOTONEGAT TVE; 
Bnmefe( 

goto END; 
NOT NEGATEVE: 

[a ae ie (a Wa 
IN 


ICI 


} 


目 使 用 if...else 语句 的 好 处 
众所周知 ，C 语言 程序 设计 中 else 语句 的 使 用 不 是 必 不 可 少 的 ， 替 
代 方 案 是 使 用 goto 语句 。 其 功能 是 跳 转 至 指定 的 某 行 ， 这 很 好 理解 。 
那么 ， 上 面 的 代码 便于 理解 吗 ? 至 少 在 笔者 看 来 ， 这 段 代 码 烦 杂 、 
结构 差 ， 如 果 不 瞪 大 眼睛 仔细 读 很 难 理解 。 我 们 将 其 和 直接 使 用 证 ..else 
语句 的 代码 比较 下 ， 来 看 看 哪 种 方式 更 便于 理解 。 
(CE 


volo UsSeone( im x | 


〇 也 有 条 件 不 颠倒 的 写法 ， 由 于 篇 幅 所 限 ， 在 此 不 介绍 它 的 代码 实现 了 。 
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TFI OU 
ET 

relse Jf(x 0 
ee re 

}elsef 
EN 

} 

} 


导 和 人 if...else 语句 的 好 处 正在 于 此 。 针 对 条 件 为 真 为 假 的 不 同情 况 分 
流 处 理 ， 这 样 的 模式 在 程序 设计 中 屡见不鲜 。 为 了 能 简洁 地 表达 并 方便 
轻松 地 阅 该 这 种 逻辑 ， 于 是 引入 了 让 .else 语句 这 种 新 的 规则 。 

程序 设计 中 else 语句 并 不 是 必需 的 。 但 是 ， 笔 者 还 是 乐于 使 用 else 
语句 ， 毕 葛 这 能 让 程序 编写 更 加 轻松 。 另 外 ， 笔 者 也 希望 别人 能 使 用 
它 ， 毕 竟 这 也 能 让 理解 程序 更 轻松 。 


本 
while 语句 一 一 让 反复 执行 的 if 语句 更 简洁 


下 面 我 们 来 考察 一 下 while 语句 。while 语句 是 指 满足 条 件 时 反复 执 
行 某 区 间 中 的 代码 ”。 


| 使 用 while 语句 的 表达 方式 

首先 ， 我 们 来 看 一 段 使 用 了 while 语句 的 代码 ， 它 表示 只 要 满足 条 
件 x>0， 束 会 反复 执行 打印 显示 x 并 减 1 的 操作 。 
GE 


void Use while(int x)l 


printf ("use while\n"),; 
while(x > 0){ 
BrilmeEe (SGANa xx); 


(DD 严格 来 讲 ， 这 只 是 在 while 语句 后 存在 多 行 代码 的 情况 。 有 了 时候 while 语句 后 面 也 
可 能 只 有 单行 代码 。 
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| 不 使 用 while 语句 的 表达 方式 


要 达到 同样 的 目的 ， 不 使 用 while 语 名 可 以 实现 吗 ?答案 是 肯定 的 。 
赶紧 来 看 看 下 面 的 代码 吧 ， 它 表示 的 是 条 件 不 满足 时 跳 转 至 END_ 
LOOP， 然 后 打印 显示 x 并 减 1， 再 跳 转 回 条 件 判断 语句 前 。 

GE 


Void not Use while(ine Ri 


printf ("not use while\n"); 
START LOOP: 

TE(U 0 ot END LOOP: 
ElnEE (nSeN\ar, x); 

2 

GSE© START LOOR; 
END LOOP: 


ECV? 


} 


很 多 语言 定义 了 用 于 中 断 循 环 的 break 语句 ， 执 行 break 语句 后 立 
刻 从 循环 中 跳出 。 这 个 动作 和 goto END LOOP 是 一 样 的 。 

像 这 样 ，while 语句 和 break 语句 做 的 只 是 那些 只 要 有 goto 语句 就 
能 做 的 事情 。while 语句 带 来 的 附加 值 不 是 新 的 功能 ， 而 是 程序 的 易 读 
性 和 吻 与 性 。 

goto 语句 是 很 强大 也 很 容易 理解 的 概念 ， 但 是 过 于 原始 。 如 有 果 随 意 
使 用 goto 语句 ， 程 序 将 彻底 散 了 架 。 再 好 的 马 ， 不配 上 纺 强 也 不 能 为 人 
们 所 用 ，goto 语句 的 使 用 也 需要 加 以 限制 ,这样 才 便 于 代码 的 理解 。 
if...else 、while 、break， 这 些 就 是 加 以 限制 了 的 goto 语句 。 


(DD 参见 艾 效 格 . 迪 科 斯 彻 “go to statement considered harmful”, communications of the 
ACM, Vol.11, No.3, ACM, 1968, p.3 。 
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4.4 for 语句 


让 数值 渐 增 的 while 语句 更 简洁 | 35 


4 .4 
for 语句 一 一 让 数值 渐 增 的 while 语句 更 简洁 
笔者 曾 有 耳闻 ， 大 学 里 初学 C 语言 时 ， 有 些 人 提出 ， 有 了 while 语 


句 ，for 语句 不 要 也 可 以 。 有 这 种 质疑 其 实 并 不 奇怪 ， 因 为 实际 上 for 语 
句 能 实现 的 功能 用 while 语句 已 经 能 够 实现 了 。 


i 使 用 for 语句 的 表达 方式 


我 们 来 考察 下 面 的 for 语句 ， 它 表示 i 在 0 至 NN 的 范围 内 按 1 递增 
同时 打印 显示 。 
for(ie=°000 1 < N19) 1 


[Drimes (SN\ar, 1)s 


} 


| 不 使 用 for 语句 的 表达 方式 
同样 的 逻辑 使 用 while 语句 来 表达 ， 就 变 成 了 下 面 这 样 。 


i = 0; 
while(i < N){ 
rimes (vrSeN\ar, 1); 


1++; 


对 在 0 至 NN 范围 的 菏 数 做 某 种 操作 ， 这 样 的 需求 时 党 能 磁 到 。 比 
如 ， 要 对 数组 xs 中 全 部 数值 做 某 种 处 理 ， 即 ， 要 对 从 xs[0] 到 xs[N-1] 
范围 内 的 各 个 元 素 做 处 理 。 如 果 用 while 语句 来 表达 ， 就 需要 在 循环 体 
外 写 =0， 循环 条 件 写 i<N， 循 环 体 最 后 写 it+。 代 人 码 分 散在 三 处 ， 对 于 
阅读 代码 的 人 来 说 ， 原 本 的 意图 没 那 么 直观 。 用 for 语句 就 不 同 了 ， 相 
关 代 码 更 加 紧 竣 ， 代 人 码 阅 读者 很 容易 就 能 理解 循环 的 意图 ( 图 4.1 )。 
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1 图 4.1 三 处 散落 的 代码 在 for 语句 中 只 存在 于 一 处 


像 这 样 ， 融 有 初 值 、 递 增值 和 终 值 这 三 组 数 的 for 语句 ， 早 在 于 
1958 年 发 明 的 ALGOL 58 语言 里 就 已 经 出 现 了 “， 


OE LT 0 (1 ) NN oo 


| foreach 一 根据 处 理 的 对 象 来 控制 循环 操作 


for 语句 已 经 有 了 新 的 发 展 ， 这 就 是 目前 许多 声言 里 采用 的 foreach 
句 型 。 在 Java 语言 里 被 称 为 扩展 for 语句 ， 而 在 Perl”、PHP 、C# 等 众多 
语言 里 被 叫做 foreach 语句 。 本 书 为 了 体现 其 与 for 语句 的 区 别 ， 把 它 称 
为 foreach 语句 “。 

while 语句 通过 条 件 判 断 来 控制 循环 操作 ，for 语句 通过 循环 次 数 来 
控制 循环 操作 “， 而 foreach 句 型 则 是 通过 处 理 的 对 象 来 控制 循环 操作 。 

在 没有 foreach 语句 的 C 语言 里 ，for 语句 常常 被 用 来 实现 对 数组 里 
各 元 系 的 处 理 操作 。foreach 的 句 型 的 产生 ， 就 是 为 了 方便 编写 对 某 对 象 
内 所 有 元 素 进行 某 种 处 理 的 代码 。 


(DD 参见 A.J. PERLIS and K. SAMELSON, “Report on the Algorithmic Language ALGOL 
by the ACM Committee on Programming Languages and the GAMM Committee on 
Programming” , Numberische Mathematik, Bd.1, S.41-60, 1959, p.50. 

在 Perl 语言 中 ，for 和 foreach 为 同义词 ， 为 了 方便 阅读 ， 两 者 在 语言 中 都 有 提供 。 
Python 语言 的 for 语句 就 是 foreach， 它 反而 没有 相当 于 C 语 言 里 功能 的 for 语句 。 
准确 来 讲 ，for 语句 也 是 通过 条 件 判 断 来 控制 的 ， 但 它 主 要 体现 的 还 是 对 循环 次 数 
的 跟踪 。 


电 鸭 的 
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ED 
// 数组 
Jnell itemns = new mel 2 


// 用 一 般 的 for 语 句 输 出 各 元 素 

for(int i = 0 1 < items.length; i++)1 
int item = items [i]; 
Sveeenaome omen 


} 


// 用 扩展 的 for 语 句 输 出 各 元 素 
for(int item: items){ 


System.out .println (item),; 


如 上 上 ，for 语 句 表 达 的 是 在 0 至 数组 items 长 度 旋 围 以 内 ， 对 i 按 1 
递增 同时 打印 显示 数组 items 第 i 个 元 素 。 使 用 了 foreach 语句 后 ， 意 思 
就 变 成 了 将 数组 items 里 的 各 个 元 素 都 打印 显示 出 来 ， 相 当地 简洁 易 懂 。 


4.2 
小 结 


本 章 我 们 学 习 了 证 语句 、while 语句 、for 语句 等 用 来 控制 程序 流程 
的 语法 规则 。 虽 然 不 使 用 这 些 话 句 也 可 以 编写 程序 ， 但 是 使 用 它们 会 让 
我 们 的 程序 变 得 更 容易 理解 。 所 以 ， 为 了 写 出 简洁 易 懂 的 程序 ， 请 大 家 
多 使 用 这 些 程序 流程 控制 语句 吧 。 
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5.2 ”返回 命令 42 


5.3 递归 调用 47 


2.4 


小 结 忆 2 
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为 什么 会 有 函数 呢 ? 

本 章 我 们 将 学 习 函 数 诞 生 的 过 程 。 

同时 ， 我 们 会 学 习 因 函数 的 发 明 而 出 现 的 递归 调用 ， 了 解 它 是 怎么 样 一 
种 程序 行为 ， 以 及 它 在 何 时 使 用 。 


2.17 
函数 的 作用 


在 第 4 章 中 ， 我 们 学 习 了 证 语句 、for 语句 、while 语句 等 产生 的 原 
因 。 本 章 我 们 来 学 习 函 数 ， 即 把 代码 的 一 部 分 视 作 有 机 整体 ， 然 后 切 分 
出 来 并 为 之 命名 的 程序 设计 机 制 “。 

函数 为 什么 必 不 可 少 呢 ?” 有 没有 因为 没有 函数 而 不 能 编写 的 程序 
呢 ? 答案 是 否定 的 。 尽 管 没 有 函数 也 可 以 编写 程序 ， 但 使 用 函数 编写 程 
序 将 变 得 更 轻松 简便 : 因为 它 便于 理解 和 重复 使 用 。 


| 便于 理解 一 如 同一 个 组 织 


把 代码 切 分 为 多 个 函数 ， 如 同 将 一 个 大 的 组 织 按 部 门 划 分 开 。 在 一 
个 小 的 程序 中 ， 也 数 的 优越 性 体现 不 出 来 ， 这 和 没 必要 把 几 个 关系 融 沧 
的 人 组 成 一 个 部 门 让 大 家 互相 熟悉 是 一 个 道理 。 人 数 很 少 的 话 ， 立 子 里 
的 每 个 人 都 熟知 其 他 人 的 姓名 、 长 相 和 特长 。 同 样 ， 代 码 数 很 少 的 情况 
下 ， 很 容易 就 能 把 握 每 一 行 执行 什么 功能 。 

问题 是 ， 人 数 一 旦 多 起 来 怎么 办 。 这 样 一 来 ， 把 握 方方面面 的 事情 
变 得 越 来 越 困难 。 因 此 ， 可 以 把 菜 些 人 视 作 一 个 单独 的 小 组 并 为 这 个 小 


JJ 这 种 机 制 在 不 同时 期 和 不 同 语言 中 , 有 事务 、 程 序 (procedure)、 子 程序 (subroutine ) 
等 不 同 的 叫 法 。 但 大 多 数 人 都 习惯 称 它 为 “函数 "。 另 外 ， 类 似 的 机 制 还 有 方法 
(method )。 关 于 这 个 我 们 会 在 第 11 章 讲解 ， 这 里 我 们 为 简单 起 见 ， 将 函数 和 方法 
等 同 视 之 。 
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组 取 个 名 字 ， 比 如 财务 部 、 茶 开发 组 等 。 
程序 设计 上 也 一 样 。 源 代码 的 行 数 多 起 来 后 要 把 握 整 体 就 变 得 困难 
起 来 。 因 此 ， 把 一 定 行 数 的 代码 视 作 一 个 整体 并 为 之 取 名 ， 这 就 是 郧 数 。 


| 便于 再 利用 一 一 如 同 零 部 件 


构建 函数 类 似 于 将 小 的 零 部 件 组 合 起 来 制造 大 的 零 部 件 。 比 如 ,无 
线 遥 控 玩 具 车 里 有 碱 性 电池 和 电机 ， 把 碱 性 电池 和 电机 放 到 指定 的 位 
置 ， 就 能 把 玩具 车 组 装 起 来 。 

事实 上 ,电机 中 还 包含 线圈 、 磁 铁 和 整流 子 “， 而 碱 性 电池 中 有 二 氧 
化 猛 、 锌 和 和 氧 氧化 钾 。 

要 无 线 遥 控 玩 具 车 ， 当 然 首先 要 制作 电机 和 电池 。 为 此 ， 就 要 理解 
电机 是 如 何 将 电流 转化 成 旋转 运动 以 及 电池 中 发 生 了 怎样 的 化 学 反应 从 
而 产生 了 电 。 现 实 中 ， 把 二 氧化 猛 、 锌 和 和 氧 氧 化 钾 配 置 包装 起 来 并 销售 
的 东西 已 经 存在 ， 那 就 是 碱 性 电池 ， 在 便利 店 等 地 方 很 容易 就 能 买 到 。 
电机 也 能 在 塑料 模型 用 品 店 里 轻松 买 到 。 

函数 也 一 样 。 将 数 十 行 、 数 百 行 代码 作为 函数 ， 通 过 简单 地 调用 就 
能 使 用 它 的 功能 ”。 

另外 ， 电 池 这 一 命名 方式 有 助 于 理解 使 用 了 电池 的 系统 功能 。 即 使 
不 知道 电池 内 部 的 详细 结构 与 工作 原理 ， 只 要 知道 “电池 就 是 能 产生 电 
的 东西 ”这 一 点 ， 小 学 生 也 能 组 装 无 线 遥 控 玩具 车 。 并 且 ， 玩 具 车 一 旦 
行驶 缓慢 就 会 让 人 想到 是 不 是 电池 快 没 电 了 。 这 个 道理 和 函数 有 助 于 理 
解 程序 是 类 似 的 。 


i 程序 中 再 利用 的 特征 


编写 程序 和 制造 物理 实体 有 一 个 很 大 的 区 别 ， 那 加 是 重复 使 用 零 音 
件 时 所 产生 的 成 本 的 类 型 。 


四 这 是 电机 中 非常 重要 的 零 部 件 之 一 ， 它 通过 切换 线圈 中 电流 的 方向 保证 线圈 持续 
地 朝 一 个 方向 旋转 。 

( 也 许 有 人 说 ， 不 理解 其 中 内 容 就 拿 来 使 用 不 太 好 。 这 种 看 法 是 可 以 理解 的 ， 但 与 
本 文 论述 无 关 ， 这 里 不 作 讨 论 。 
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看 个 例子 ， 假 如 要 为 整 栋 公寓 楼 所 有 房间 的 水 龙头 安装 净 水 右 ， 公 
富 楼 有 100 个 房间 的 话 就 需要 配备 100 个 净 水 器 ， 相 应 地 ， 有 200 个 房 
间 的 话 就 要 200 个 净 水 器 。 房 间 数 量 越 多 ， 所 耗费 的 资金 和 空间 资源 也 
就 越 多 。 

我 们 再 回 到 程序 中 ,假如 要 用 某 个 函数 来 处 理 列 表 中 所 有 的 数据 ， 
有 100 个 数据 的 话 就 要 调用 此 孔 数 100 次， 有 200 个 的 话 就 要 调用 
200 次 。 数 据 量 越 多 ， 所 需 的 执行 时 间 也 就 越 长 。 但 是 ， 函 数 的 实现 
只 需 一 个 就 足够 了 ， 调用 200 次 并 不 需要 将 此 洱 数 实现 200 次 。 通 过 
把 需要 反复 执行 的 操作 封装 成 函数 ， 进 而 多 次 调用 ， 可 以 确保 源 代码 紧 
凑 且 清晰 。 

把 相同 的 操作 封装 在 一 起 的 好 处 不 仅仅 在 于 使 程序 更 简短 ， 也 在 
于 能 使 阅读 程序 的 人 无 需 反 复读 取 相 同 内 容 的 源 代 码 。 从 宛 长 的 程序 
中 切 分 出 反复 使 用 的 代码 将 其 封装 成 一 个 整体 ， 程 序 就 更 容易 理解 了 。 


> 
返回 命令 


从 第 4 章 我 们 了 解 到 ，if 语 句 、while 语句 、for 语句 全 部 都 可 以 借 
助 goto 语句 实现 。 但 是 从 源 代码 再 利用 的 角度 来 看 ， 仪 仅 依 徘 goto 语 
句 是 不 够 的 。 

goto 语句 无 法 将 程序 返回 原来 的 位 置 。 我 们 期 望 的 运行 是 ， 执 行 跳 
转 语 名 时 记 住 这 一 位 置 ， 之 后 碰 到 返回 语句 时 又 能 跳 转 回 到 该 位 置 后 面 
的 语句 。 

有 了 返回 原来 的 位 置 这 样 的 命令 ， 代 码 的 再 利用 成 为 可 能 。 一 个 程 
序 中 有 几 处 执行 相同 的 操作 时 ， 就 可 以 把 这 些 操作 封装 在 一 个 地 方 了 
(图 5.1)。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


1 图 5.1 返回 命令 使 代码 再 利用 成 为 可 能 
处 理 流 程 


| 函数 的 诞生 


把 反复 使 用 的 命令 封装 在 一 起 再 利用 ， 这 种 需求 在 很 早 以 前 就 有 
了 。1949 年 的 EDSAC 就 使 用 了 带 有 这 一 功能 的 技术 "。 

当时 ， 程 序 的 命令 和 数据 完全 都 存储 在 内 存 中 ， 修 改 程序 就 如 同 把 
数值 代入 变量 中 一 样 简单 。 通 过 修改 程序 中 跳 转 命令 的 跳 转 目的 地 ， 就 
能 使 函数 调用 后 返回 原来 的 位 置 “。 


e 1: 将 110 处 跳 转 命令 的 跳 转 日 的 地 改写 为 3 处 


(DD 当时 还 没有 为 之 取 名 以 便于 理解 。1949 年 编写 的 “The Square Program” 中 ，92 
处 和 114 处 的 指令 将 原先 放置 在 75 处 的 跳 转 命令 的 跳 转 目的 地 改写 了 。 这 里 仅 对 
该 技术 作 简 单 说 明 ， 详 细 的 源 代 码 和 解释 可 以 参考 该 PDF 文件 链接 : http://www. 
cl.cam.ac.uk/~mrl0/edsacposter.pdf, 

@ 也 许 有 人 说 ， 这 个 因为 没有 返回 值 ， 所 以 不 是 函数 而 是 子 程序 (subroutine )。 这 
么 说 没 错 ， 但 本 书 将 子 程序 也 归 为 函数 进行 说 明 。 
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e 2: 调用 函数 ( 跳 转 至 100 处 ) 


下 


e 51: 将 110 处 跳 转 命令 的 跳 转 目的 地 改写 为 $3 处 
e 52: 调用 函数 ( 跳 转 至 100 处 ) 


® 53 F— TM 


[Hp 
@...... 
e 100: 函数 操作 
@...... 


® 110: 返回 ( 跳 转 至 0 处 ) 
就 这 样 ， 函 数 诞 生 了 “。 


| 记录 跳 转 目的 地 的 专用 内 存 


在 函数 调用 前 修改 返回 命令 的 跳 转 目的 地 时 ， 函 数 调 用 者 必须 同时 
知道 跳 转 目的 地 在 哪里 和 返回 命令 所 在 地 在 哪里 。 这 是 很 难 办 到 的 。 假 
如 在 函数 中 增加 几 行 代码 ， 返 回 命令 的 位 置 就 会 相应 地 往 后 挪 一 些 。 这 
样 一 来 ， 就 不 得 不 修改 调用 这 一 函数 的 全 部 代码 。 

后 来 出 现 了 稍微 改良 过 的 方法 ， 即 创建 用 来 事先 记录 返回 目的 地 的 
内 存 空间 ， 并 设计 能 跳 转 到 该 内 存 空间 里 记录 的 地 址 的 命令 。 这 样 ， 即 
使 函数 调用 前 不 知道 返回 命令 所 在 地 也 没关系 了 ”。 


e 1: 将 3 写 入 返回 目的 地 内 存 
e 2: 调用 函数 ( 跳 转 至 100 处 ) 


e 100: 函数 操作 


QD 其 他 领域 也 在 使 用 函数 这 个 概念 。 比 如 ， 作 为 数学 用 语 的 函数 ( function ) 是 莱 布 
尼 茨 于 1673 年 最 早 使 用 的 。 在 理论 计算 机 科学 领域 ，1930 年 发 明 的 入 演算 也 使 
用 了 函数 这 个 概念 ， 通 过 建 模 说 明 计算 的 本 质 。 

@ 这 里 的 返回 目的 地 内 存 通常 位 于 寄存 器 的 高 速 存储 装置 中 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


e 101: 返回 至 返回 目的 地 内 存 所 记录 的 地 址 


然而 ， 这 种 方法 也 有 一 个 问题 。 当 调用 国 数 X 期 间 又 调用 了 郴 数 Y 
时 ， 返 回 目 的 地 内 存 被 写 窗 新 ， 卫 数 义 执行 之 后 应 该 返回 的 上 日 的 地 地 址 
就 找 不 到 了 。 这 时 该 如 何 处 理 呢 ? 


函数 命名 


说 到 函数 为 操作 命名 的 好 处 和 实现 方法 ， 其 实 和 函数 之 外 的 其 他 因素 也 
有 关系 6 

使 用 函数 给 操作 命名 的 做 法 ， 融 是 用 便于 理解 的 字符 串 取 代数 值 ， 来 表 
示 操 作 开始 时 内 存 的 位 置 。 这 和 变量 一 样 。 变 量 的 诞生 ， 束 是 为 了 用 字符 串 
蔡 代 数值 来 表示 存储 了 某 个 值 的 内 存 的 位 置 。 

关于 名 字 和 作用 域 的 相关 内 容 ， 我 们 将 在 第 7 草 详 细 论 述 。 


| 权 


栈 终于 登场 了 “。 栈 是 一 种 存储 有 多 个 值 的 数据 结构 ,实现 最 后 被 存 
入 的 值 最 先 被 读 取 。 在 第 3 章 介 绍 FORTH 语言 时 我 们 也 有 提 到 。 

那么 栈 具体 是 怎么 实现 的 呢 ? 首先 ， 决 定 记 录 栈 顶 位 置 〈 即 最 后 被 
存 入 的 数据 的 地 址 ) 的 内 存 地 址 。 图 5.2 中 这 一 地 址 就 是 42。 之 后 每 当 
存 入 新 数据 时 将 按 步骤 执行 ，42 处 数值 加 1 后 把 数据 存 人 该 数值 指向 的 
地 址 ”。 

最 初 的 状态 (图 5.2@) 如 下 : 


e 42: 栈 顶 在 哪 〈 当前 值 : 100 ) 


(DD 此 外 还 有 其 他 方法 ， 比 如 为 函数 分 别 准备 记录 返回 位 置 的 场所 。 早 期 的 
FORTRAN 语言 就 采用 了 这 种 方法 。 但 在 调用 函数 X 期 间 再 次 调用 函数 X 时 ， 这 
种 方法 就 无 法 知道 返回 目的 地 了 ， 无 法 实现 下 一 节 中 讲 的 递归 调用 。 

@ 此 处 的 42 没有 什么 特殊 含义 。 
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@ 100: 
将 了 艺 数 XX 的 返回 目的 地 写 和 该 栈 后 的 状态 (图 5.2@ ) 如 下 : 


e 42: 栈 顶 在 哪 ( 当前 值 : 101 ) 
@ 100: 
e 101: 国 数 X 的 返回 目的 地 


然后 把 函数 的 返回 目的 地 写 人 栈 。42 处 的 值 加 1 后 变 成 102， 数 
据 被 写 入 102 处 (图 5.2@)。 


e 42: 栈 顶 在 哪 〈 当前 值 : 102 ) 


@ 100: 
e 101: 函数 X 的 返回 目的 地 
e 102: 函数 Y 的 返回 目的 地 


1 图 5.2 在 栈 中 写 入 值 


101 102 103 


0O 42 100 

| | | 1 
栈 顶 位 置 
是 100 


100 102 103 


函数 X 的 | 函数 X 的 
返回 目的 地 | 返回 目的 地 


栈 项 位 置 
是 102 A 
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接 下 来 ， 我 们 来 看 一 下 数据 的 读 取 过 程 。 数 据 读 取 时 按照 步 台 ， 先 
读 42 处 数值 指 癌 的 地 址 上 存储 的 数据 ， 再 将 42 处 数值 减 1 (图 5.3 )。 
e 42: 栈 顶 在 哪 ( 当前 值 : 101 ) 
@ 100: 
e 101: 函数 X 的 返回 目的 地 
e 102: 函数 Y 的 返回 目的 地 
1 图 5.3 ”从 栈 中 读 取 值 


42 100 101 TO2 103 


函数 X | 函数 X 
的 返回 | 的 返回 


目的 地 | 目的 地 


栈 项 位 置 


是 102 
dA2 100 101 102 103 
函数 X | 函数 X 
101 …， 的 返回 | 的 返回 


目的 地 | 目的 地 


栈 项 位 置 
是 101 


这 样 一 来 ， 即 使 在 调用 函数 X 期 间 又 调用 了 孔 数 Y， 也 不 至 于 把 隙 
数 X 的 返回 目的 地 写 窗 盖 ,程序 可 以 顺利 地 返回 


pe 
递归 调用 


所 请 递归 调用 ， 是 指 函 数 内 部 再 次 调用 当前 也 数 的 过 程 。 过 去 有 些 
语言 无 法 实现 递归 调用 ， 现 在 几乎 所 有 语言 都 支持 这 一 编程 技术 。 
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| 嵌 套 结构 体 的 高 效 处 理 


递归 调用 是 不 可 或 缺 的 吗 ? 不 ， 当 然 不 是 。 使 用 了 递归 调用 的 程 
序 ， 也 可 以 不 用 递归 调用 来 实现 “。 

那么 ,递归 调用 这 种 程序 设计 技巧 为 什么 会 产生 并 一 直 被 使 用 呢 ? 
这 是 因为 ， 对 于 某 些 类 型 的 操作 ， 使 用 递归 调用 可 以 使 程序 编写 变 得 轻 
松 很 多 。 这 里 指 的 是 那些 执行 某 些 步骤 中 途 又 针对 不 同 对 象 (参数 ) 执 
行 相同 步 又 的 情况 ， 即 符 套 结构 体 的 情况 。 处 理 符 套 的 数据 结构 时 ， 代 
码 通常 也 会 变 成 嵌 套 结构 。 


| 嵌 套 结构 体 的 处 理 方法 


在 物理 实体 的 制造 中 ， 要 说 某 零 部 件 是 使 用 该 去 部 件 自 己 制 造 出 来 
的 ， 这 是 极其 难以 想象 的 一 件 事 。 初 学 程序 设计 时 ， 很 多 人 对 递归 调用 
感到 困惑 。 作 为 处 理 舱 套 结构 的 一 个 例子 ， 我 们 来 看 一 下 为 散 套 列表 的 
全 部 元 素 求 和 的 问题 “。 

比如 ，[1,2,[3,4],5] 这 样 一 个 列表 ， 可 以 看 作 是 将 [3,4] 这 个 列表 凯 
套 放 和 [1,2,?,5] 这 个 列表 产生 的 。 要 为 这 样 一 个 艇 套 结构 的 列表 里 所 有 
元 素 求 和 ， 该 如 何 实现 呢 ? 

下 面 的 Python 代码 使 用 for 语句 把 列表 中 的 元 素 逐 个 取出 ， 如 果 为 
整数 则 做 相 加 运算 ， 执 行情 况 如 下 。™ 


GE 时 ( 全 SS 让 于 


ESESUIIC 三 


QD 最 坏 情况 下 ， 自 己 来 设计 栈 也 是 可 以 实现 的 。 比 如 把 使 用 了 递归 调用 的 汉 诺 塔 求 
解 过 程 用 不 带 递归 调用 的 方式 实现 。 这 就 是 一 个 不 错 的 练习 。 

@ 顺便 一 提 ， 笔 者 认为 使 用 阶 和 来 计算 和 匡 波 那 回 数 列 计算 这 两 个 例子 来 讲解 递归 调 
用 怒 有 不 有 要。 这 是 因为 ， 这 两 个 计算 不 需要 递归 调用 ,使 用 普通 的 循环 体 就 可 以 
实现 ， 并 且 对 于 裴 波 那 契 数列 计算 如 果 简 单 地 使 用 递归 ， 其 性 能 比 使 用 循环 体 要 
闫 很 多 。 

(BB) 在 Python 语言 中 不 存在 ji integer 这 个 函数 ， 实 际 起 相同 作用 的 是 isinstance(x， 
int) 函数 。 因 为 这 个 无 关 正 题 ， 在 这 里 我 们 选择 使 用 一 个 名 字 更 好 理解 的 函数 。 
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EG Rw ln Se 
# 逐个 取出 列表 xs 中 的 元 素 放 进 x 
1 和 4 名 MEeGer ES 下 
# 如 果 x 为 整数 则 做 加 法 
result += Xx 


else: 


# 如 果 x 不 为 整数 该 如 何 处 理 ? ? 


return result 


最 早出 来 的 是 1 和 2， 因 为 它们 都 是 整数 ， 所 以 与 result 做 加 法 ， 
最 后 结果 是 3。 到 此 为 止 都 很 顺利 ， 但 接 下 来 出 现 的 [3,4] 不 是 整数 了 ， 


这 个 该 如 何人 处 理 呢 ? 


外 无 法 用 for 语句 实现 
也 许 有 人 说 ， 因 为 这 是 一 个 列表 ， 在 for 语句 结构 中 对 其 元 素 做 特 
ou 就 行 了 。 对 于 这 个 例子 中 的 输入 数据 ， 这 种 实现 方法 恰巧 是 可 
行 的 。 对 于 最 多 仪 有 两 重 航 套 的 输入 数据 ， 只 要 用 二 重 for 语句 就 可 以 
处 理 。 但 是 ， 输 入 为 三 重 般 套 结 构 的 列表 又 会 怎样 呢 ? 此 时 第 二 个 for 
语句 的 处 理 中 又 磁 到 一 个 列表 ， 对 这 个 列表 该 怎么 处 理 呢 ? 


@leriq ee ea 


人 SUJLE 三 (0 
全 
1 和 4 名 MPG Ed 
result += XxX 
全 外 号 会 : 
# x 为 列表 ， 所 以 用 for 语 句 处 理 
过 @E WW LL 焉 5 
i 4 TMEeGaE(Y) 3 
XESSulE Te Y 


else: 


# 再 来 一 个 列表 时 该 如 何 处 理 呢 ? 


return result 


此 处 即使 再 妃 加 一 个 for 语句 ， 这 上 段 程序 也 只 是 针对 三 重 舱 套 结 构 
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的 处 理 管用 ， 如 宁 数 据 有 四 重 、 五 重 明 套 就 无 法 处 理 了 。 

这 种 多 重 般 僚 的 数据 结构 并 不 罕见 ， 比 如 HTML 语言 中 的 标签 就 有 
儿 十 层 舱 侠 。 人 处 理 这 样 的 数据 结构 ， 需 要 的 是 不 管 多 少 层 般 侠 都 能 做 处 
理 的 机 制 ， 多 次 藤 僚 for 语句 是 无 法 做 到 的 。 
由 使 用 递归 调用 

于 是 就 有 了 递归 调用 。 这 种 方法 在 实现 对 肯 套 列表 元 素 求 和 的 函数 
total 中 ， 又 调用 该 函数 和 目 吴 ， 如 同 该 函数 已 经 实现 完成 了 一 样 。 


leryseorann es: 


ESESUULE 三 0 
EGE XR lm Kas 
nie ee: 
result += XxX 
ES 
# X 为 蓄 套 列表 ， 所 以 用 total 求 里 面 的 元 素 的 总 和 


result += total (x) 


return result 


这 样 就 完成 了 。 不 管 对 函数 total 传递 几 重 般 套 结构 体 的 列表 ， 部 能 
把 它 里 面 的 元 系 的 和 求 出 来 。 


和 递归 调用 执行 时 的 程序 流 

给 函数 total 传递 参数 [1, [2, 3], 4] 并 调用 会 发 生 什 么 呢 ? 我 们 顺 春 
递归 调用 的 执行 过 程 一 起 来 看 一 下 。 

首 完 ， 函 数 total 带 有 参数 [1, [2, 3], 4] 被 调用 时 ，xs 为 [1, [2, 3], 4]， 
result 为 1 (图 5.4 )。 

然后 开始 执行 for 语句 循环 。 先 把 xs 的 第 一 个 元 系 取 出 ， 为 整数 的 
1， 故 执行 result 加 1，result 由 0 变 成 1( 图 5.3”)。 


(DD 此 图 为 简化 图 形 ， 未 把 X 放 入 其 中 。 
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和 图 5.4 循环 开始 前 有 1 图 5.5 对 1 的 操作 


xs:[1,[2,3],4] xS:|1,[2,3],4] 
result:0 result: 合 1 


然后 循环 至 下 一 个 元 素 。 把 xs 的 第 二 个 元 系 取 出 ， 发 现 是 非 整数 
的 [2, 3]。 为 了 求解 这 个 数组 的 和 ， 把 [2, 3] 作为 参数 调用 吨 数 total。 在 
第 二 个 调用 中 ，xs 为 [2, 3]，result 为 0 (图 5.6 )。 


1 图 5.6 [2, 3] 非 整 数 故 递归 调用 total 


xSs:[1,[2,3],4] XS:|2.3| 
result:1 result:0 


第 二 个 调用 中 的 for 语句 开始 执行 。 把 xs 的 第 一 个 元 素 取出 ， 为 整 
数 的 2， 故 执行 result 加 2，result 由 0 变 成 2 (图 5.7 )。 


1 图 5.7 处理 [2, 3] 中 的 2 


xs:[1,[2,3],4] xs:[2,3] 
result:1 result 合 2 


第 二 个 调用 中 的 for 语句 继续 执行 。 把 xs 的 第 二 个 元 素 取出 ， 为 整 
数 的 3， 故 执行 result 加 3，result 由 2 变 成 5 (图 5.8 )。 
和 图 5.8 ”处理 [2, 3] 中 的 3 


xs:[1,[2,3],4] xS:[2,3] 
result:1 result: 舍 会 5 


这 样 第 二 个 调用 中 的 for 语句 循环 结束 。 循 环 体 外 有 return result， 
把 此 时 result 的 值 $ 返 回 困 数 调 用 的 地 方 。 在 函数 调用 处 ， 返 回 值 与 
result 相 加 ，tesult 由 1 变 成 6 (图 5.9 )。 
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1 图 5.9 ”返回 5 后 对 1, [2, 3] 的 处 理 结束 


xs:[1,[2,3],4] 
result: 生 6 5 


把 xs 的 第 三 个 元 素 取 出 ， 为 整数 的 4， 故 执行 result 加 4，result 由 
6 变 成 10 (图 5.10 )。 


1 图 5.10 处理 最 后 的 4 


xs:[1,[2,3],4] 
result: 人 10 


total 的 第 一 次 调用 中 的 for 语句 执行 完毕 ，result 值 为 10， 故 将 10 
返回 至 水 数 调用 的 地 方 。 

这 样 就 成 功 地 返回 了 正确 的 结果 。 在 这 个 执行 过 程 中 ， 和 针对 每 次 阴 
数 调用 都 有 单独 的 地 方 用 来 存储 xs 和 result 的 值 ， 并且 在 第 二 个 total 
执行 结束 时 第 一 个 total 能 紧 接 着 执行 ， 这 两 点 值得 注意 ”。 


2.4 
小 结 


随 着 程序 变 得 越 来 越 庞 大 ， 把 握 全 局 逐渐 地 变 得 困难 起 来 。 同 时 ， 
有 可 能 需要 多 次 用 到 非常 相似 的 操作 。 

函数 就 是 为 解决 这 个 问题 产生 的 。 通 过 在 语义 上 把 一 整 块 代码 切 分 
出 来 为 之 命名 ， 理 解 这 段 代 人 码 变 得 更 加 容易 。 此 外 ， 通 过 在 其 他 地 方 调 
用 这 个 函数 ， 实 现 了 代码 的 再 利用 。 

伴随 着 函 数 的 使 用 产生 了 递归 调用 这 一 编程 搁 巧 ， 它 非常 适合 处 理 
通 套 形式 的 数据 。 


QQ) 在 这 个 例子 中 ,每 次 函数 调用 时 都 有 各 自 的 result 值 ， 这 是 因为 result 是 函数 的 局 
变 


部 变量 ,在 此 不 做 深入 说 明 。 全 局 变量 和 局 部 变量 的 区 别 我 们 将 在 第 7 章 详 细 论 述 。 


中 
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程序 在 执行 过 程 中 也 有 可 能 出 错 ， 出 错时 如 何 处 理 ( 错误 处 理 ) 很 重要 。 
音 误 处 理 的 方法 大 体 可 分 为 两 种 : 使 用 返回 值 和 使 用 异常 ( 异常 处 理 )。 

除 C 语言 外 ， 多 数 语 言 都 支持 异常 处 理 。 

本 章 我 们 将 回顾 异常 处理 的 发 展 历 史 ， 分 析 它 为 什么 是 分 天 的 形态 ， 与 
使 用 返回 值 的 方法 相 比 它 的 优势 所 在 ， 以 及 其 仍 有 答 解 决 的 问题 。 


Cad 
程序 也 会 出 错 


当今 很 多 语言 都 支持 异常 处 理 这 各 机制， 如 Java、C++、Python、 
Ruby 等 语言 。 但 是 C 语言 是 不 文 持 这 种 机 制 的 。 因 此 ， 以 C 语言 入门 
学 习 程 序 设计 的 人 不 少 都 对 为 何 需 要 异常 处 理 这 个 问题 认识 模糊 。 本 章 
会 说 明 寞 党 处 理 产 生 的 目的 、 它 是 如 何 发 展 的 ， 以 及 异 当 处理 中 仍然 尚 
存 的 问题 。 

程序 也 会 出 错 ， 比 如 写 和 文件 时 ， 如 果 磁 航空 间 不 足 写 入 操作 就 会 
失败 。 再 如 ， 用 迷 气 灶 烧 开水 时 ， 如 果 火 被 风 吹 炙 ,煤气 将 充满 房屋 。 
如 有 果 煤 气 泄漏 检测 仪 没有 检测 到 这 一 险情 并 报警 的 话 ， 后 采 将 不 堪 设 
想 ， 或 将 醇 成 煤气 爆炸 这 样 的 大 灾难 。* 

程序 的 出 错 也 一 样 。 写 入 文件 失败 时 ， 如 果 没 有 任何 和 警告， 用 户 就 
难以 察觉。 用 户 可 能 会 误 以 为 这 些 非 党 重要 的 数据 已 经 成 功 写 人 磁盘 
中 ， 从 而 把 原始 数据 删除 。 为 了 能 使 用 户 在 灾难 发 生前 有 所 和 警觉， 程序 
设计 语言 需要 具备 和 煤气 泄漏 检测 仪 一 样 的 错误 传达 机 制 。 


四 当然 ， 运 气 好 的 话 可 能 会 闭 到 煤气 气味 而 不 至 于 本 成 大 祸 ， 但 这 毕竟 是 靠 运气 。 
现在 城市 供应 的 煤气 中 通常 会 特意 加 入 硫化 所 等 有 恶臭 味 的 添加 物 ， 就 是 为 了 让 
大 家 能 尽早 发 现 煤气 泄漏 ， 尽 量 减少 对 运气 的 依赖 ， 从 而 构建 起 双重 安全 保障 。 
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6.2 
如 何 传 达 错 误 


假设 有 一 个 执行 时 可 能 出 错 的 函数 ， 取 名 为 shippai。 调 用 这 个 函数 
时 ， 有 可 能 成 功 也 有 可 能 出 错 。 那 么 该 如 何 分 别 编写 成 功 时 的 操作 和 出 
错时 的 操作 ( 错误 处 理 ) 呢 ? 

错误 处 理 的 编写 方法 大 体 可 分 为 两 种 。 一 种 是 利用 shippai 消 数 的 
返回 值 来 传达 程序 出 错 的 信息 ， 吗 数 调 用 方 通 过 检查 返回 值 来 相应 地 对 
错误 进行 处 理 。 另 一 种 是 在 调用 shippai 函数 前 设 定 好 错误 处 理 的 代码 ， 
错误 发 生 时 能 跳 转 至 相应 的 错误 处 理 代 人 码 。 前 者 至 今 还 在 C 语言 等 语言 
中 经 党 使用， 后 者 则 被 称 为 异常 处 理 。 


| 通过 返回 值 传达 出 错 信息 


我 们 首先 来 看 通过 返回 值 传达 出 错 信 息 的 方法 。 比 如 ，shippai 晒 数 
事先 将 返回 值 定 义 为 成 功 执行 时 返回 0 值 ， 出 错时 返回 0 以 外 的 值 。 机 
数 调用 方 在 调用 shippai 晒 数 后 ， 会 检查 其 返回 值 ， 返 回 非 0 值 时 会 进 
行 错 误 处 理 。 

if (!1shippai ()){ 
/* 错误 处 理 */ 
} 
梁 茎 即 为 广 非 05 

这 也 就 是 说 ， 出 错时 把 信息 写 入 返回 值 ， 接 着 做 返回 值 检 查 。 与 之 
相 类 似 的 有 先行 定义 全 局 变量 接收 错误 信息 的 方法 ， 还 有 在 也 数 调用 方 
定义 变量 作为 引用 形 参 接收 错误 信息 的 方法 。 无 论 哪 种 ， 尊 循 的 都 是 出 
错时 写 人 信息 然后 做 检查 的 思路 。 

这 种 方法 在 C 语言 等 众多 语言 中 广泛 使 用 。 但 是 它 有 两 个 问题 : 


e 错误 处 理 导 致 代码 可 该 性 下 降 
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下 面 我 们 来 详细 讨论 这 两 个 问题 。 


和 遗漏 错误 

首先 是 遗漏 错误 ， 程 序 员 忘记 了 对 返回 值 做 检查 ， 从 而 遗漏 了 错误 。 

程序 员 也 是 普通 人 ， 他 们 也 会 时 常 忘 记 shippai 函数 有 可 能 会 出 错 。 
如 此 一 来 ，shippai 函数 调用 完 后 没有 对 返回 值 做 检查 ， 按 照 执 行 成 功 的 
固定 思维 编写 了 代码 “。 

如 果 shippai 困 数 是 一 个 极 少 执行 出 错 的 因数 ， 那 这 段 代码 在 大 多 
数 情况 下 都 可 以 正确 运行 ， 程 序 员 就 会 深信 这 段 代 人 码 没有 问题 。 发 现 有 
问题 时 ， 正 是 shippai 函数 执行 出 错 ， 程 序 执行 与 预期 不 一 致 的 时 候 。 
谁 都 不 知道 这 将 是 什么 时 候 的 事 了 ， 或 许 是 在 产品 正式 发 布 了 之 后 。 

这 种 情况 下 ， 由 于 编写 代码 和 发 现 问 题 在 时 间 上 已 经 相差 较 远 ， 代 
码 问 题 的 追查 往往 会 很 芋 兰 。 此 外 ， 由 于 shippai 图 数 执行 出 错 ， 某 个 
值 可 能 与 期 待 值 不 一 样 ， 进 而 导致 列 的 国 数 执行 出 错 ， 如 此 下 去 将 形成 
多 米 诡 上 骨牌 式 的 连锁 反应 。 问 题 是 在 看 起 来 和 shippai 本 数 没有 任何 关 
系 的 地 方 被 发 现 的 ， 这 样 一 来 就 更 难 发 现 真正 的 问题 所 在 了 。 

理想 的 情况 是 ， 程 序 员 在 准备 调用 哨 数 时 ， 先 确认 好 该 函数 是 否 可 
能 执行 出 错 以 及 出 错时 返回 什么 值 。 如 果 能 严格 按 此 操作 进行 ， 使 用 返 
回 值 传达 错误 的 方法 应 该 不 会 造成 遗漏 错误 的 情况 。 人 然而， 现实 中 因 忘 
记 检 查 返 回 值 导致 错误 的 情况 不 胜 枚 举 。 

那 该 怎么 办 呢 ? 


和 错误 处 理 导致 代码 可 读 性 下 降 
接 下 来 ,我 们 来 看 第 二 个 问题 。 知 道 了 第 一 个 问题 ， 对 所 有 的 函数 
调用 都 做 仔细 的 检查 以 免 遗 漏 错 误 ， 然 后 着 手 编写 错误 处 理 的 代码 ， 然 
而 接 只 而 来 的 是 为 一 个 问题 。 由 于 蚀 误 人 处理， 源 代码 变 得 很 难 读 慌 。 
执行 三 个 可 能 出 错 的 操作 ， 如 末 在 某 处 操作 失败 ， 接 下 来 的 操作 就 
不 会 被 执行 转 而 进行 错误 处 理 。 这 里 的 三 个 操作 依次 是 shippai("A")、 
shippai("B")、shippai("C")， 程 序 代码 如 下 : 


QD) 比如 ，C 语言 中 写 入 文件 操作 时 常用 到 fprintf 这 个 函数 ， 它 在 执行 出 错时 返回 值 
为 负 。 你 对 这 个 有 做 检查 吗 ? 还 是 想当然 以 为 执行 成 功 从 而 遗漏 了 错误 呢 ? 
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Jnc eo maim() dl 
oe ee i 0 
/* 失败 时 的 处 理 */ 
/* 失败 时 的 处 理 */ 
/* 失败 时 的 处 理 */ 
| 
:bE 
/* 失败 时 的 处 理 */ 
/* 失败 时 的 处 理 */ 
relse fF(lenioBal( CR 
/* 失败 时 的 处 理 */ 
/* 失败 时 的 处 理 */ 
/* 失败 时 的 处 理 */ 


本 来 想 要 执行 三 个 操作 ， 而 在 代码 实现 中 引入 了 大 量 错误 处 理 代 
码 ， 夹 在 本 意 要 执行 的 操作 中 ， 这 使 程序 流 变 得 难以 读 慌 。 

那么 就 没有 可 读 性 更 好 的 编写 方法 吗 ” 如 果 钳 误 处 理 相同 ”, 能 不 能 
集中 处 理 ? 怎么 样 才能 集中 起 来 呢 ? 
上 通过 跳 转 集中 进行 错误 处 理 

为 了 集中 进行 错误 处 理 而 使 用 异常 ， 但 C 语言 里 并 没有 异常 这 一 机 
制 。 它 使 用 goto 语句 。 下 面 的 代码 把 错误 发 生 时 的 处 理 用 goto 语句 集 
中 起 来 ”。 
GE 


Tmnee maim( 


1 (lanlaadal (uA)) OE RAORg 
lfE (Lanaaal (BV)) GOES DRAORS 
lf (lnladal (Cn)) GOEG BRRORg 


(DD 比如， 打开 日 志文 件 ， 增 加 标识 执行 失败 的 信息 ， 然 后 关闭 日 志文 件 这 样 的 错误 
处 理 。 

@ Linux 的 发 明 者 林 纳 斯 . 托 拟 效 (Linus Torvalds ) 在 其 文章 “Linux 内 核 编码 风格 ” 
中 推荐 使 用 goto 语句 把 函数 的 结尾 处 理 集中 起 来 。 英 文 版 可 参照 : http://www. 


linuxfromscratch.org/alfs/view/hackerpart2/hackercoding-style.html。 
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I el 
国民 于 

/* 失败 时 的 处 理 */ 

/* 失败 时 的 处 理 */ 

/* 失败 时 的 处 理 */ 

} 

我 们 来 看 一 下 这 段 代 人 码 ， 执 行 shippai("A") 如 果 出 错 ， 跳 转 至 
ERROR。 成 功 则 移 至 下 一 行 执行 shippai("B")， 如 果 出 错 跳 转 至 
ERROR。 同 样 执行 shippai("C")， 如 果 出 错 ， 跳 转 至 ERROR。 如 果 都 成 
功 则 执行 下 一 行 return， 返 回 跳 出 函数 。 这 样 ， 错 误 处 理 只 在 跳 转 至 
ERROR 处 时 才 被 执行 。 

从 代码 形式 上 看 ， 这 就 做 到 了 把 针对 出 错时 的 代码 和 记述 本 来 想 做 
的 事 的 代码 分 离 。 


| 出 错 则 跳 转 


到 此 为 止 ， 我们 学 习 了 传达 错误 的 方法 之 一 一 一 通过 返回 值 传达 错 
误 。 现 今 ， 这 一 方法 在 以 C 语 言 等 很 多 语言 中 被 广泛 使 用 。 

实际 上 ,在 C 语言 诞生 以 前 就 已 经 存在 其 他 错误 处 理 方 法 。 这 种 方 
法 事先 定义 好 了 错误 发 生 时 跳 转 的 位 置 ， 后 来 ， 它 演变 为 现在 的 异常 处 
理 。 为 更 好 理解 地 异常 处 理 产 生 的 原因 ， 我 们 来 回顾 一 下 那 段 历史 。 
UNIVACI 

事实 上 ， 错 误 发 生 时 跳 转 这 一 想法 的 产生 甚至 比 程序 设计 语言 的 产 
生还 要 早 。1950 年 设计 的 计算 机 UNIVACI 中 就 有 了 这 样 的 功能 ， 在 
计算 中 出 现 溢出 时 ， 它 会 执行 在 000 处 编写 的 命令 。 这 种 功能 被 称 为 
“中 断 ”(interrupt )， 广 泛 被 运用 于 错误 处 理 等 各 领域 中 。 比 如 ， 键 盘 
上 某 按 键 被 按 下 时 ，CPU 就 能 收 到 按键 信号 ， 传 达 这 一 消息 的 就 是 中 断 
功能 。 
有 COBOL 

早期 的 程序 设计 语言 是 如 何 进行 错误 处 理 的 呢 ? 1954 年 出 现 的 程 
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序 设计 语言 FORTRAN 语言 中 还 没有 异常 处 理 机 制 ， 直 到 1959 年 ， 新 
问世 的 COBOL 语言 中 才 设 计 了 两 种 类 型 的 错误 处 理 机 制 。 与 现代 异常 
处 理 中 的 通用 语句 结构 不 一 样 的 是 ， 这 两 种 类 型 的 错误 处 理 都 有 各 上 自 独 
特 的 语句 结构 。 一 种 结构 是 用 READ 命令 读 取 文件 时 ， 由 AT END 关键 
字 引 出 没有 数据 等 错误 处 理 的 语句 。 男 一 种 结构 是 用 ADD 命令 做 数值 
的 四 则 运算 时 ， 由 ON SIZE 关键 字 引 出 溢出 等 错误 处 理 的 语句 。 


READ < 文件 名 > AT END < 错误 处 理 语句 > 
ADD < 了 消 数 名 > ON SIZE ERROR < 错误 处 理 语 句 3 


当时 错误 处 理 仅 有 这 两 种 类 型 ， 程 序 员 无 法 自由 增加 设计 错误 的 种 
类 ， 这 和 现代 的 异常 处 理 机 制 是 不 同 的 “。 


EPL/ 

到 了 1964 年 ，PL/I 程序 设计 语言 诞生 了 ， 它 是 FORTRAN 语言 、 
COBOL 语言 、 ALGOL 语言 的 集大成 ”, 为 实现 灵活 统一 的 错误 处 理 , 引 
入 了 ON 语句 结构 。 当 时 有 的 PL/ 教材 中 列举 GOTO 、IF、DO 和 ON 
这 四 种 语句 来 讲解 控制 语句 ， 它 们 分 别 对 应 跳 转 语句 、 条 件 语句 、 循 环 
语句 和 异常 处 理 “。 

与 6.2.1 市 介绍 的 C 语言 代码 相近 ， 下 面 的 代码 是 在 PL/I 语言 中 的 
表现 方式 。 


SHORI: procedure,; 
on error go to ERROR.; /* 出 错时 跳 转 至 ERROR 处 的 意思 */ 
Gall Balaaal (1l)s 


dall Bilaaal (2)s 
Call Baaal(3)s 


See 


(DD 《情报 处 理 月 例会 资料 》( 中 文 译名 : 信息 处 理 每 月 例会 资料 ) 1965/8/24 

@ 《7 了 7 口 分 王 六 > 分 言语 0) 历 史上 展望 》( 中文 译 名 : 程序 设计 语言 的 历史 与 展望 )， 
中 田 育 男 ,《 情 报 妃 理 》( 中 文 译名 : 信息 处 理 ) Vol.21, No5, 1980 年 ，p.574。 

BB)《 力 办 站 害 二 WV、7 口 狂风 这 4》( 中文 译 名 : 简单 易 懂 的 程序 设计 4 PLII)， 竹 
下 享 ，1969 年 。 
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ERROR: < 失败 时 的 处 理 >， 

< 失败 时 的 处 理 > ; 

< 失败 时 的 处 理 >， 
end; 

C 语言 代码 中 通过 使 用 证 语句 来 检查 返回 值 ， 这 里 已 经 没有 检查 操 
作 。 这 里 体现 的 思想 是 ， 不 是 让 程序 设计 者 编写 程序 时 ， 时 刻 记 着 不 能 
忘记 返回 值 检查 ， 而 是 让 语言 处 理 各 来 目 动 检查 是 否 出 错 。 

另外 , 在 COBOL 语言 中 仅 有 的 两 种 错误 类 型 的 基础 上 ，PL/I 中 可 
以 追加 定义 新 的 错误 类 型 ， 从 而 可 以 根据 错误 类 型 的 不 同 ， 轻松 地 变 
错误 处 理 的 操作 。 

EI 


/* 定义 名 为 MY ERROR 的 条 件 */ 
GleaveRORNeomnen Eien 


emgeonce een oR 

begin; 

/* MY_ERROR 发 生 时 的 错误 处 理 */ 

end; 

PL/I 语言 的 错误 处 理 机 制 还 有 男 一 种 重要 功能 ， 程 序 可 以 主动 触发 
新 定义 的 错误 类 型 。 在 C 语言 通过 返回 值 传 达 错 误 的 方法 中 ， 如 果 是 
return -1， 就 会 返回 -1 癌 调 用 处 传达 出 错 信 息 。 而 在 PLM 语言 中 ,， 通 
过 语句 signal condition (MY ERROR)， 可 以 触发 MY ERROR， 传达 出 
错 信 息 。 
人 99 


/* 触发 MY_ERROR */ 
Semaneen ono 


HH 


可 追加 错误 类 型 和 可 目 主 触发 出 错 ， 这 两 种 功能 为 现代 的 异 稼 处 理 
机 制 所 继承 ， 具 有 重要 意义 “。 


G 〇 当时 不 叫 失败 或 异常 ， 叫 条 件 (condition )。 另 外 ， 抛 出 异常 的 命令 也 不 是 现在 一 
般 的 raise 或 throw， 而 是 signal。 
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0 .3 
将 可 能 出 错 的 代码 括 起 来 的 语句 结构 


至 此 我 们 了 解 到 ， 到 1964 年 PL/I 语言 诞生 时 ， 很 多 对 当今 的 异常 
处 理 意义 重大 的 特征 已 经 被 提出 来 了 了 ， 如 允许 定义 出 错时 的 处 理 操作 ， 
可 以 追加 新 的 错误 类 型 ， 可 以 自主 触发 出 错 等 。 

然而 ， 它 和 现在 Java 语言 、C++ 语言 、Python 语言 等 采用 的 异常 
处 理 的 语句 结构 有 很 大 的 不 同 。PL/I 语言 是 先 定义 好 出 错时 的 处 理 操 
作 ， 再 编写 可 能 出 错 的 代码 。 与 这 种 形式 不 同 的 是 ，Java 等 语言 是 先 
(用 try{...} 括 起 来 ) 编写 可 能 出 错 的 代码 ， 然 后 编写 出 错时 的 处 理 操作 。 
那么 这 种 语句 结构 是 何 时 、 基 于 什么 原因 产生 的 呢 ? 


| John Goodenough 的 观点 


1975 年 ,John Goodenough 在 上 日 己 的 论文 2 中 提出 了 一 种 更 好 的 异常 
处 理 的 方法 “。 他 的 观点 是 这 样 的 : 命令 有 可 能 会 抛 出 异常 ， 而 程序 员 有 
可 能 起 记 这 种 可 能 性 ， 也 可 能 在 不 正确 的 地 方 编写 异 瘦 处理 或 者 编写 不 
正确 类 型 的 异 浓 处 理 。 为 使 编译 需 能 够 对 程序 员 的 错误 发 出 警告 ， 减 少 
这 种 可 能 性 ， 需 要 做 到 两 点 。 一 是 明确 声明 命令 可 能 抛 出 何 种 异常 ， 二 
是 需要 有 将 可 能 出 错 的 操作 括 起 来 的 语句 结构 。 

以 这 里 提议 的 括 起 来 的 语句 为 基础 ， 现 代 大 部 分 语言 采用 了 先 括 起 
来 可 能 出 钳 的 操作 ， 再 编写 错误 处 理 的 语句 结构 。 明 确 声 明 命 令 可 能 
出 何 种 异常 ， 这 个 设计 方针 在 Java 语言 的 异常 检查 中 得 以 继承 ， 我 们 将 
在 后 面 的 6.6 市 中 详细 解说 。 


(D John B. Goodenough, “Exception handling: issues and a proposed notation”, 
Communications of the ACM, Vol.18 Issue 12, ACM, 1975, pp.683-696 此 时 把 失败 称 
为 异常 ( exception ) 已 经 很 普遍 了 。 

(2 John Goodenough 在 创作 这 篇 论文 时 是 SofTech, Inc 的 职员 ， 之 后 担任 卡耐基 梅 
隆 大 学 软件 工程 研究 所 的 最 高 技术 负责 人 。 更 多 详细 资料 请 参考 : http://wwwi.sei. 
cmu.edu/about/people/profile.cfm?id=goodenough 12984 
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| 引入 CLU 语言 


从 1975 年 Goodenough 的 论文 发 表 直 到 1977 年 ， 程 序 设 计 语 言 
CLU” 引入 了 异常 处 理 的 机 制 ， 追 加 了 置 于 命令 后 面 的 错误 处 理 语句 结 
构 except。CLU 语言 从 最 初 就 具有 用 begin... end 将 代码 括 成 块 状 的 功 
能 ， 这 一 功能 和 except 相 绪 合 ， 就 实现 了 将 可 能 出 错 的 操作 括 起 来 再 补 
充 错误 处 理 的 代码 编写 方式 。 以 下 是 一 段 CLU 语言 代码 ， 从 百 分 号 到 
句 末 为 注释 。 错 误 的 类 型 ， 可 以 是 诸如 除数 为 去 时 的 zero_division  。 


CLU 
begin 
% 可 能 出 错 的 操作 
% 可 能 出 错 的 操作 
end except when 错误 的 类 型 : 
gs 出 错时 的 处 理 
%$ 出 错时 的 处 理 


end. 


| 引入 C++ 语言 


不 久 后 的 1983 年 ，C++ 语言 诞生 。 针 对 异 稼 处 理 的 语句 结构 问题 
从 1984 年 到 1989 年 间 经 历 了 多 次 讨论 ，C++ 语言 最 终 确 认 追 加 一 
种 语句 结构 ， 把 关键 学 try 放 在 那些 被 括 起 来 的 可 能 出 错 代 人 码 的 前 
面 ， 把 关键 字 catch 放 在 捕捉 并 处 理 错 误 的 代码 块 前 面 ”。 按 照 C++ 
语言 设计 者 斯 特 劳 斯 特 卢 普 ( Bjarne Stroustrup ) 的 说 法 ，try 只 是 一 
个 为 了 方便 理解 的 修饰 符 “。 


(D 后 文 介绍 Liskov 置换 原则 的 章节 中 会 提 到 CLU 语言 的 发 明 者 Barbara Liskov ， 
请 参考 12.1 节 。 

(2 CLU 语言 中 抛 出 异常 的 命令 和 PL/I 语言 一 样 ， 都 为 signal。 

BB) 关于 这 个 过 程 的 详细 描述 ， 请 参考 斯 特 劳 斯 特 卢 普 的 著作 The Design and 
Evolution of C++。BASIC 语言 和 PL/[ 语言 具有 的 错误 处 理 后 返回 出 错 那 行 的 
resume 功能 ， 该 功能 被 取消 的 过 程 颇 为 有 起， 推荐 读者 阅读 。 

由 “try 也 不 是 必需 的 ， 但 没有 它 理解 不 便 ， 因 此 最 终 决定 引入 这 一 看 起 来 多 余 的 关 
键 字 ”。 请 参考 斯 特 劳 斯 特 卢 普 的 著作 The Desien and Evolution orC++。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


6.3 ”将 可 能 出 错 的 代码 括 起 来 的 语句 结构 | 63 


ee 
tw 
Vr 
/* 可 能 出 错 的 代码 */ 
| 本 | 
/* 错误 处 理 命令 */ 
/* 错误 处 理 命令 */ 


另外 , C++ 语言 还 选用 throw 作为 触发 异常 的 命令 "。 之 所 以 没 选 择 
PL/I 语言 和 CLU 语言 中 使 用 的 signal， 是 因为 signal 已 经 在 标准 库 中 被 
使 用 了 。 于 是 ， 触 发 异常 的 表述 就 变 成 了 抛 出 异常 。 


i 引入 Windows NT 3.1 


上 世纪 90 年 代 初 ， 微 软 公司 开始 用 C 语言 编写 新 的 Windows 操作 
系统 ， 这 就 是 1993 年 发 布 的 Windows NT 3.1。 这 个 版 本 的 制作 时 ， 也 
考虑 到 需要 有 便于 操作 的 错误 处 理 机 制 ， 于 是 在 操作 系统 和 C 语言 编 
译 佑 导入 了 结构 化 异常 处 理 ( Structured Exception Handling，SEH ) 的 
概念 。 结 构 化 异常 处 理 中 ,除了 将 可 能 出 错 的 代码 括 起 来 的 __try 和 
将 错误 处 理 的 代码 括 起 来 的 ”except 之 外 ,还 有 将 即使 出 错 也 要 执行 
的 代码 括 起 来 的 __finally。 绪 合 随 后 出 现 的 语言 中 的 叫 法 ,我 们 把 表 
示 即 使 出 错 也 要 执行 的 关键 字 称 为 finally。 下 一 节 我 们 来 讲 finally 的 
必要 性 。 


C 语 言 中 使 用 SHE 的 代码 


| 
el 
/* 可 能 出 错 的 代码 */ 
/* 可 能 出 错 的 代码 */ 
Pe 
/* 出 错 与 不 出 错 都 要 执行 的 代码 */ 


(“使 用 throw 这 一 关键 字 是 因为 更 易 理 解 的 raise 和 singal 两 个 关键 字 已 经 在 标准 
库 作 为 水 数 名 字 占 用 了 ”。 请 参考 斯 特 劳 斯 特 卢 普 的 著作 The Desien and Evolution 
of C++s 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


64 | 第 6 章 错误 处 理 


} 


Eee 
/* 错误 处 理 的 代码 */ 
} 


0.4 
出 口 只 要 一 个 


| 汶 件 炮 引入 nally 


微软 公司 为 什么 会 引入 finally 呢 ? 是 为 了 解决 什么 样 的 问题 呢 ? 他 
们 是 这 样 回 答 的 。 


采用 结构 化 异常 处 理 可 以 提高 代码 的 可 靠 性 。 比 如 ， 程 序 在 程 
序 员 预料 之 外 结束 时 ， 也 可 以 正确 地 释放 锁定 的 内 存 和 文件 等 资源 。 
- 
人 


检查 返回 值 ， 使 用 简洁 的 结构 化 代码 就 可 以 应 对 。 


“异常 处 理 ( SEH > 
http://msdn.microsoft.com/ja-jp/library/aa984822(v=vVvs.71).aspx 


‖ 成 对 操作 的 无 遗漏 执行 


在 程序 设计 中 有 很 多 成 对 的 操作 ， 比 如 内 存 锁定 后 要 和 释放， 文件 打 
开 后 要 关闭 ， 上 锁 之 后 要 解锁 等 。 成 对 的 操作 只 要 执行 了 其 中 一 个 ， 就 
要 保证 为 一 个 也 能 确实 执行 。 微 软 公司 前 面 提 到 的 “正确 地 释放 资源 ”， 
指 的 就 是 无 遗漏 地 执行 成 对 操作 。 对 错误 处 理 ， 则 要 能 够 不 使 用 返回 值 
检查 和 goto 语句 ， 人 简洁 地 实现 。 

拿 美 术 馆 来 打 个 比方 吧 。 在 入 口 借 出 的 语 首 导航 仪 随 后 需要 全 部 回 
收 。 只 有 一 个 出 口 的 话 ， 全 部 回收 并 非 难 事 。 但 是 如 果 有 多 个 出 口 ,不 
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在 每 一 个 出 口 都 配备 专人 的 话 ， 就 不 一 定 能 做 到 无 遗漏 全 部 回收 。 如 果 
连 墙壁 都 没有 ， 随 处 都 可 以 出 去 的 话 ， 要 无 遗漏 地 全 部 回收 就 更 困难 了 。 
程序 设计 也 一 样 。 如 果 在 人 口 处 执行 了 lock， 随 后 就 需要 执行 

unlock。 如 果 限 数 出 口 (return ) 只 有 一 个 ， 只 要 在 出 口 前 执行 unlock 
即 可 。 但 如 果 有 好 几 个 return， 就 需要 在 每 一 个 return 前 面 执行 unlock。 
一 个 被 调用 的 也 数 ， 如 果 在 多 处 部 有 抛 出 异常 的 可 能 性 ， 那 么 在 很 多 个 
地 方 都 有 可 能 跳出 这 个 函数 ， 此 时 要 无 遗漏 地 执行 unlock 就 变 得 非常 困 
难 了 。 

ee ms: 

/* 需要 上 锁 的 处 理 */ 

,a | 

unlock (m) ; /* < 在 出 口 前 解锁 */ 


1 Elen 


} 
/* 需要 上 锁 的 处 理 */ 
unlock (m) ; /* 和 二 在 出 口 前 解锁 */ 


I en 
这 个 问题 的 解决 办 法 有 三 种 。 


和 使 用 finally 的 解决 方案 

finally 代码 块 在 try 代码 块 执行 结束 后 一 定 会 被 执行 到 ， 而 不 管 try 
代码 块 中 是 否 发 生 异 常 。1990 年 左右 ， 微 软 公 司 开始 使 用 finally，1995 
年 发 布 的 Java 语言 也 引入 了 finally。 现 今 ，Python 语言 和 Ruby 语言 也 
支持 同样 的 语句 结构 ”。 


EE 
/* 可 能 出 错 的 代码 */ 
pl 


/* 异常 处 理 代码 */ 
| 


(D 顺便 说 一 下 ，Python 语言 中 还 有 else 小 节 ， 这 些 代码 在 try 小 节 成 功 执行 后 能 继 
续 被 执行 并 且 不 需要 捕捉 可 能 的 异常 。 
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/* 必 将 执行 的 代码 */ 
} 


begin 

# 可 能 出 错 的 代码 
rescue 

# 可 能 出 错 的 代码 
ensure 

# 可 能 出 错 的 代码 


end. 


es: 

# 可 能 出 错 的 代码 
Eee 

# 异常 处 理 代码 
finally: 

# 必 将 执行 的 代码 


和 没有 finally 的 C++ 语言 的 解决 方案 

C++ 语言 中 没有 finally。 那 它 是 如 何 表 现 不 管 异 党 是 否 发 生 都 要 执 
行 的 代码 的 呢 ? 

C++ 语言 中 使 用 了 一 种 名 叫 RAI ( Resource Acquisition Is Initialization ， 
资源 获取 即 初始 化 ) 的 技术 。 比 如 ， 在 操作 打开 了 就 要 关闭 的 文件 对 象 
时 ， 定 义 来 操作 该 对 象 的 类 ， 用 构造 函数 打开 ， 用 析 构 函数 关闭 ”。 


ni 
class SampleRAIIT { 
Sud Gs 
// 构造 函数 
SampleRAITI () 


: resource (lock()) { 


(DD 不 习惯 C++ 语言 的 读者 可 以 这 样 理 解 : 简单 来 讨 ， 构 造 函 数 和 析 构 函数 就 是 对 象 
在 被 创建 时 调用 的 初始 化 处 理 和 在 消除 时 调用 的 事后 处 理 。 
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// 析 构 函数 
~SampleRAII() { 


waloele() s 


这 种 技术 在 函数 结束 时 ， 针 对 函数 的 局 部 变量 ， 程 序 可 以 目 动 地 调 
用 析 构 函数 ”"。C++ 语言 设计 者 斯 特 劳 斯 特 卢 普 认 为 ， 比 起 使 用 finally， 
这 种 方法 更 为 优雅 。 
和 D 语言 中 scope (exit) 的 解决 方案 

2001 年 出 现 的 DD 语言 以 改良 C++ 语言 为 目标 ， 反 对 了 RAII 是 优雅 的 
这 一 站 多。 

打开 了 就 要 关闭 这 样 紧密 关联 的 操作 ， 反 映 在 代码 上 时 ， 如 果 能 放 
在 相近 的 位 置 就 容易 理解 多 了 。 基 于 这 一 考虑 ,DD 语言 中 引入 了 作用 域 
守护 ( scope guard ) 的 概念 。 通 过 使 用 作用 域 守 护 ， 可 以 事先 定义 从 某 
一 作用 域 ( 如 函数 ) 跳出 时 执行 的 操作 。 


DD 语言 
vad aoel) 


{ 


Mutex m = new Mutex; 


lock (m) ; // 锁 住 mutex 


acope ex mioeo nn // 定义 作用 域 结束 时 的 解锁 操作 
Fool( // 执行 操作 


(DD 严格 来 讲 ， 不 是 函数 而 是 空间 范围 ， 为 避免 C++ 语言 里 复杂 的 空间 范围 的 话题 ， 
此 处 做 了 简单 化 处 理 。 另 外 ， 实 际 上 lock 和 unlock 是 带 有 参数 的 ， 代 码 会 比 这 更 
复杂 ， 这 一 点 也 进行 了 简单 化 处 理 。 
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6.5 
何 时 抛 出 异常 


到 此 为 止 ， 我 们 学 习 了 try/catch 括 起 来 的 异常 处 理 结 构 语 句 是 怎样 
产生 和 发 展 的 ， 主 要 围绕 异常 被 所 出 来 之 后 如 何 处 理 进行 了 解说 。 接 下 
来 我 们 要 转移 一 下 焦点 ， 来 学 习 异 常 是 什么 时 候 抛 出 来 的 。 

错误 发 生 时 ， 有 返回 返回 值 和 抛 出 异常 两 种 传达 方法 。 那 么 ， 什 么 
时 候 使 用 返回 值 的 方法 ， 什 么 时 候 使 用 异常 的 方法 呢 ? 2000 年 左右 ， 
有 种 观点 认为 , 异常 的 方法 仅 限于 异常 的 情况 下 使 用 ”, 那么 异常 的 情况 
又 是 指 哪些 情况 呢 ? 


| 函数 调用 时 参数 不 足 的 情况 


这 里 我 们 列举 Python、Ruby、JavaScript 这 三 种 脚本 语言 ， 来 比较 
各 种 语言 分 别 在 什么 时 候 抛 出 异常 。 比 如 ， 调 用 一 个 带 有 两 个 参数 的 部 
数 但 只 传递 一 个 参数 时 会 发 生 什 么 ? Python 语言 和 Ruby 语言 会 在 图 数 
调用 的 时 刻 抛 出 异常 。 但 是 JavaScript 语言 会 把 缺失 的 参数 当 作 未 定义 
的 特殊 值 ( undefined ) 继续 执行 。 


GE EGG 汉 ) 


BELNAE KY 
EOD (1) 


结果 ( 异常 ) 
Traceback (most recent call last): 
Ean emo Nnoowles 
EG@D (1) 


TypeError: foo() takes exactly 2 arguments (1 given) 


def foo(x, y) 


(DD 参照 http://www.ibm.conmy/developerworks/jp/java/library/j-perf02104/index.html 
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I9 3p YY 
end 
IE@@ 站 

结果 ( 异 单 ) 


tmp.rb:1:in “foo': wrong number of arguments (1 for 2) (ArgumentError) 


Enememe Nl sm 


JavVaScript 


fanet ron too (| 


console.log (x, y); 


EO@O (1) 


结果 ( 成 功 ) 


1 undefined 


| 数组 越界 的 情况 


还 有 一 种 情况 ， 比 如 ， 试 图 读 取 一 个 只 有 三 个 数 的 数组 的 第 四 个 数 
值 时 会 怎么 样 ? 这 就 是 数组 的 界外 操作 。 此 时 ，Python 语言 会 抛 出 异 
常 ，Ruby 语言 会 返回 一 个 指示 不 存在 的 特殊 值 (nil )， 而 JavaScript 语 
言 会 返回 undefined。 


区 二 LO ， 由 7 2] 
BSElineE 区 [3 


结果 ( 异 吊 ) 
Traceback (most recent call last): 
Esme emeoN Naa<meoenn lis 
jm [3] 


IndexError: list index out of range 
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区 三 LO， 业 7 马 ‖ 3 


console.log (x[3]); 


结果 ( 成 功 ) 
undefined 
以 上 三 种 语言 的 设计 者 都 是 具有 高 超 技 术 能 力 的 程序 设计 员 ， 即 便 
是 他 们 ， 就 何 种 情况 应 该 抛 出 异常 也 不 能 达成 一 怪 。 异 和 常 应 该 在 何 种 情 
况 下 使 用 ， 何 为 异常 的 情况 ， 这 些 问 题 是 没有 正确 答案 的 。 


| 出 错 后 就 要 立刻 抛 出 异常 


笔者 认为 ， 在 学 习 程 序 设计 或 者 是 一 个 人 编写 小 规模 程序 时 ， 像 
Python 语言 这 种 立刻 抛 出 异 篆 的 方式 要 比 JavaScript 语言 那样 返回 
undefined 更 好 。 

人 非 圣贤 ， 就 能 无 过 ,程序 员 也 不 例外 ， 一 不 小 心 引 入 bug 也 不 是 
不 可 能 的 。 要 保证 代码 的 品质 只 能 是 尽早 发 现 bug 并 及 时 修正 它 。 这 同 
时 说 明 ， 能 尽早 意识 到 不 对 劲 的 地 方 是 十 分 重要 的 “。 

异常 机 制 的 优点 就 在 于 ， 它 不 会 遗漏 任 何 一 处 错误 。 当 发 生 数 组 的 
界外 读 取 时 ， 我 们 希望 程序 能 抛 出 异常 ， 癌 程序 员 报 告 错 误 。 只 要 不 是 
程序 员 有 意 编写 “界外 读 取 时 返回 undefined” 这 样 的 代码 ， 界 外 读 取 的 
行为 终究 是 异 弟 事态 。 返 回 适 当 的 值 来 推迟 宜 布 异常 事态 的 发 生 ， 这 样 
也 无 法 解决 异常 “。 


QD 为 了 提高 软件 的 品质 通过 检查 代码 来 确认 程序 员 期 待 的 程序 行为 ， 这 一 测评 方法 
也 是 基于 同样 的 想法 。 

@) 因为 没有 注意 到 返回 值 为 undefined 而 继续 做 操作 ， 接 下 来 会 碰 到 “TypeError: 
Cannot read property 'foo' of undeinfed”， 这 个 对 于 JavaScript 的 程序 员 应 该 是 家 常 
便 饭 了 吧 。 
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发 生 错 误 应 该 停止 操作 立刻 报告 ， 这 一 设计 思想 被 称 为 错误 优先 
( fail first )。 软 件 的 目的 不 一 样 ， 人 简单 地 集 止 操作 有 时 可 能 不 太 妥 当 , 但 
至 少 在 学 习 和 开发 阶段 发 生 错误 后 能 立刻 注意 到 ， 这 已 经 是 一 个 很 大 的 
优点 了 。 


6.6 
异常 传递 


包括 Java 语言 在 内 的 很 多 现代 语言 的 异常 处 理 机 制 中 ， 寞 常 可 传递 
至 调用 方 。 假 设 函 数 f 调 用 函数 g， 后 者 又 调用 函数 h。 如 琳 函 数 h 中 有 
异 第 抛 出 且 在 函数 h 中 无 法 处 理 该 寞 第 ,那么 束 会 看 也 数 g 能 否 处 理 该 
异 第 。 如 玉 也 数 g 也 无 法 处 理 ， 接 下 来 就 看 吨 数 人 可 不 可 以 。 如 采 没 有 
哪个 函数 可 以 处 理 该 寞 肖 ， 程 序 就 会 异常 终止 。 


| 异常 传递 的 问题 


大 家 或 许 认 为 这 样 做 是 理所当然 的 。 其 实 关 于 这 个 意见 并 未 统一 ， 
因为 这 一 设计 有 一 个 很 大 的 问题 。 那 就 是 ， 即 使 看 到 了 函数 工 的 代码 也 
不 知道 也 数 f 可 能 会 抛 出 什么 异常 。 有 可 能 是 函数 f 调用 的 为 外 的 函数 
g 中 抛 出 的 寞 津 传递 过 来 的 ， 也 有 可 能 是 函数 g 调用 的 函数 h 抛 出 的 异 
常 。 也 就 是 说 ， 如 有 果 不 看 见 函 数 f 调用 的 所 有 的 函数 代码 ， 就 无 从 得 知 
国 数 了 抛 出 何 种 异 筑 。 万 一 没有 察觉 到 抛 出 茶 种 异常 的 可 能 性 ， 程 序 就 
有 可 能 寞 第 终止 。 


i Java 语言 的 检查 型 异常 


在 6.3.1 节 提 到 的 论文 中 ，Goodenough 主张 为 了 避免 这 一 问题 ， 需 
要 明确 地 声明 可 能 抛 出 的 异常 。Java 语言 就 采用 了 这 一 方针 ， 我 们 现在 
就 来 看 一 下 。 

其 他 语言 中 所 谓 的 异 浓 ，Java 语言 中 的 throw 语句 也 能 抛 出 ， 并 进 
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一 步 分 为 三 类 : 不 应 该 做 异常 处 理 的 重大 问题 、 可 做 异常 处 理 的 运行 时 
异常 和 可 做 异常 处 理 的 其 他 异常 。 这 里 的 其 他 异常 叫做 检查 型 异常 ， 如 
来 在 方法 之 外 抛 出 ， 就 需要 在 定义 方法 时 声明 。 

throws 就 是 为 这 个 目的 准备 的 。 以 下 代码 中 的 void shippai ( ) throws 
MyException， 实 质 上 是 声明 了 这 个 方法 有 可 能 抛 出 MyException 的 
异 第。 


cls== "ao 


// shippai 抛 出 MyException 异 常 
Void SHSpal( Enrow MVEXcCeDE lonl 


throw new MyException(),; 


} 


7/ 人 用 enepanl( 让 0) 户 NMENrToOwsS MvEXceDE lonr 
void foo() throws MyExceptiont{ 
shippai (); 


} 


// (方法 2 ) 用 catch 捕 捉 MyException 异 常 、 错 误 处 理 
vold oar (yd 


Cry 
shippai (); 
}catch (MyException e) { 


} 


} 


class MyException extends Exception {)} 


使 用 了 检查 型 异 浓 ， 就 不 会 发 生涯 查 抛 出 异常 的 可 能 性 。 当 一 个 方 
法 调用 可 能 抛 出 异常 的 方法 shippai 时 ， 可 以 选择 两 种 方法 来 实现 异常 
处 理 ， 将 shippai 抛 出 的 异常 传递 至 调用 处 ， 或 者 让 shippai 上 自己 处 理 该 
异常 。 前 者 就 如 方法 foo 那样 用 throws 声明 ， 后 者 就 如 方法 bar 那样 用 
try/catch 插 起 来 的 语句 实现 异常 处 理 。 如 果 没 有 采用 两 者 中 任何 一 种 方 
法 ， 编 闯 带 就 会 指示 出 遗漏 错误 。 
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可 以 说 检查 型 异常 是 一 种 非常 好 的 机 制 。 但 是 这 种 机 制 并 没有 很 好 
地 普及 到 其 他 语言 中 ， 这 是 为 什么 呢 ? 

一 言 以 沿 之 ， 就 是 因为 它 太 麻 烦 。 一 旦 throws 或 try/catch 中 异常 的 
数目 增多 ,或 者 某 一 方法 需要 追加 一 种 异常 ， 就 不 得 不 修改 调用 了 该 方 
ee 方法 ， 特 别 态 烦 。 

# 语言 虽然 很 大 程度 上 参考 了 Java 语言 ， 但 也 没有 采用 检查 型 异 
究 其 原因 ，C# 语言 的 设计 者 Anders Hejlsberg 如 是 说 :“ 检 查 型 

党 的 理念 本 刁 没 有 什么 不 对 的 地 方 ， 相 反 是 很 棒 的 。 然 而 在 像 Java 语 
言 Sa 它 在 解决 某 些 问题 的 同时 又 引入 了 别 的 问题 。 如 
果 能 有 更 好 的 实现 方法 ，C# 语言 或 许 也 是 可 以 借用 的 ”。” 


i 


具体 的 知识 和 抽象 的 知识 


在 语言 X 中 如 何 实现 Y， 像 这 种 具体 的 知识 ( know-how ) 可 快速 提高 
你 的 工作 效率 。 但 是 一 旦 语言 发 生变 化 ， 这 种 知识 就 无 法 再 使 用 。 世 界 瞬 
息 万 变 ， a 慢 失 去 其 价值 。 因 此 ， 
我 们 不 仅 要 学 习 具 体 的 知识 ， 更 要 有 意识 地 去 学 习 那 些 应 用 范围 广泛 的 抽 
象 的 概念 。 

当然 ， 学 习 了 抽象 的 元 知识 ， 如 果 不 将 其 与 你 具体 的 经 验 相 结合 ， 也 无 
法 在 实际 应 用 中 发 挥 其 作用 。 喜 欢 樱花 的 人 即使 剪 下 花 开 的 树 术 带 回 家 ， 终 
将 看 到 的 也 仅仅 是 枝 枯 花 败 的 场景 而 已 。 要 想 栅 花 年 年 盛开 ， 离 开 根 部 和 枝 
十 是 不 行 的 & 

我 们 所 学 的 知识 到 底 有 没有 真正 的 “根基 "， 可 以 通过 考察 能 否 具 体 地 
举例 或 者 具体 地 实现 来 确认 。 没 有 真正 根基 的 知识 是 无 法 顺 芯 摸 瓜 、 触 类 旁 
通 的 ， 所 谓 学 习 到 的 知识 也 只 能 像 鹦 融 学 舌 般 的 重复 讲 讲 而 已 。 想 要 因 地 制 
宜 地 活用 知识 更 是 缘 木 求 鱼 ， 根 本 没有 可 能 了 。 


(D 请 参考 “The Trouble with Checked Exceptions”，http:/www.artima.conyintwhandcuffs.html 
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学 习 讲求 细 咀 慢 咽 


一 口 吞 不 下 一 整 块 肉 。 首 先 要 把 肉 切 成 能 入 口 的 大 小 ， 嚼 碎 后 再 吃 。 
同样 的 道理 ， 对 抽象 的 概念 、 复 杂 的 系统 和 不 习惯 的 领域 ,我 们 也 不 可 能 
一 下 子 理 解 通 透 。 首 先 要 把 信息 切 分 ， 一 小 块 一 小 块 地 消化 吸收 到 上 自己 的 
大 脑 里 。 

然而 ， 在 信息 爆炸 时 代 ， 如 何 对 信息 做 取舍 呢 ? 什 么 信息 是 重要 的 ， 什 
么 是 不 重要 的 ? 要 判断 什么 信息 重要 首先 需要 对 其 有 深刻 的 理解 ， 但 如 此 一 
来 ， 束 陷入 到 和 有 蛋 还 是 先 有 鸡 的 困境 中 了 。 

身边 如 果 有 这 熟 巧 这些 信 息 的 人 、 朋 友 ， 向 他 们 请 教 也 是 一 种 方法 。 但 
要 是 没有 呢 ? 在 网 上 检索 得 询 的 话 ， 那 些 发 言 者 是 真 的 熟悉 还 是 装 作 熟 悉 
呢 ， 这 又 该 如 何 判 断 ? 

作者 本 人 写 的 文档 当然 是 最 为 翔实 的 。 但 是 要 么 认为 难 履 ， 要 么 认为 内 
容 太 多 ， 要 么 认为 看 美语 有 困难 ， 我 们 总 会 有 各 种 借口 放弃 查阅 原作 者 的 一 
手 资 料 ， 而 去 寻找 那些 写 得 简单 的 解说 。 这 就 如 同 ， 当 肉 太 大 、 太 硬 时 ， 转 
而 不 顾 食品 安全 ， 吃 起 别人 做 出 来 的 肉 馅 。 

这 种 心情 是 可 以 理解 的 。 笔 者 也 有 在 庞大 信息 量 面 前 心力 交 痒 的 时 候 。 
这 时 有 三 种 战略 可 供 人 参考 ， 从 需要 的 地 方 开始 阅读 ， 先 掌握 概要 再 阅读 细 
节 ， 从 头 开 始 逐 章 手 抄 。 天 于 它们 的 详细 介绍 将 在 接 下 来 的 章节 介绍 。 


6.7 
小 结 


本 章 我 们 学 习 了 程序 也 会 出 错 以 及 程序 出 错 后 是 如 何 传达 错误 的 。 
错误 传达 方法 大 致 有 两 种 ， 通 过 返回 值 传达 和 出 错 后 跳 转 。 

通过 返回 值 传达 的 方法 有 一 个 问题 ， 那 就 是 容易 忘记 检查 返回 值 从 
而 出 错 。 因 此 ， 长 期 以 来 ， 人 们 把 更 多 的 精力 放 在 研究 出 错 后 跳 转 的 方 
法 上 ， 这 一 方法 成 为 目前 被 Java、C++、Python 、Ruby 等 众多 语言 支持 
的 异常 处 理 机 制 的 基础 。 
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异常 处 理 也 有 几 个 问题 。 一 个 是 当 函 数 有 不 只 一 个 出 口 时 ， 必 须 成 
对 处 理 的 操作 很 难 正 确 地 成 对 处 理 。 另 一 个 是 即便 看 了 代码 也 不 知道 项 
数 将 抛 出 何 种 异常 。 

2012 年 ， 谷 歌 公 司 在 其 编程 守则 中 禁止 了 C++ 语言 中 异常 的 使 用 。 


使 用 异 音 的 优势 大 于 它 的 成 本 ， 尤 其 是 在 新 的 项 目 中 。 但 是 ， 
在 已 有 的 代码 中 导入 异常 时 ， 有 依存 关系 的 所 有 代码 都 会 受到 影响 。 
( 中略 ) 谷歌 公司 已 有 的 C++ 语言 代码 大 多 不 是 按 异 弟 处 理 实 现 的 。 
因此 ， 引 入 触发 异常 处 理 异 常 的 新 代码 多 少 是 有 些 困难 的 。 


《Google C++ 风格 指南 》 
http://www.textdrop.net/google-styleguide-Ja/cppguide.xml 


谷歌 公司 一 方面 认可 在 新 的 项 目 中 使 用 异常 是 好 的 ， 男 一 方面 考虑 
到 现在 已 经 有 很 多 不 是 基于 异常 处 理 实现 的 代码 ， 不 能 使 用 异常 。 这 是 
因为 ， 导 人 人 异 第 后 要 成 对 地 处 理 那 些 必须 成 对 的 操作 非常 困难 。 

Java 语言 的 开发 者 为 了 解决 第 二 个 问题 导 和 人 了 检查 型 异常 ， 但 是 这 
种 方法 并 不 太 被 接受 。C# 语言 的 开发 者 一 方面 承认 检查 型 异 第 的 优势 ， 
为 一 方面 希望 有 更 好 的 方法 出 现 。 

最 后 的 情况 如 我 们 所 见 ， 两 种 错误 传达 方法 都 是 长 处 短处 兼 具 。 把 
握 各 目的 优势 和 缺点 ， 因 地 制 宜 地 选择 使 用 哪 一 种 才 是 最 为 关键 的 。 


i 


从 需要 的 地 方 开始 阅读 


针对 面 对 庞 大 信息 量 心力 交 竣 时 该 怎么 办 的 问题 ， 我 们 在 “学 习 讲求 细 嚼 
慢 咽 ”专栏 中 介绍 了 三 种 方法 。 第 一 种 方法 就 是 “从 需要 的 地 方 开始 阅读 。 

有 时 ， 我 们 并 不 需要 掌握 一 本 书 或 者 文档 的 全 部 内 容 。 明 确 阅读 的 目的 
并 和 弄 清楚 为 达成 这 一 目的 需要 阅读 哪些 地 方 ， 就 可 以 有 针对 性 地 阅读 ， 无 需 
在 其 他 无 关 的 地 方 花 费 大 量 精力 。 

或 许 有 些 人 会 因为 不 逐 字 逐 句 仔细 阅读 而 产生 负 罪 感 。 但 是 比 起 心力 交 


(DD 英文 最 新 版 请 参考 : http://google-styleguide.googlecode.com/svn/trunk/cppguide.xml 
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疗 完 全 读 不 下 去 来 说 ， 还 是 挑 挑 拣 拣 地 阅读 更 好 吧 。 与 其 让 “ 非 全 部 读 完 不 
可 ”这 样 的 完美 主义 挫败 干劲 ， 还 不 如 放弃 不 读 呢 。 要 知道 ,干劲 是 多 么 地 
宝贵 呀 | 

使 用 这 一 方法 就 需要 对 整体 内 容 有 个 大 致 把 握 ， 并 确认 想 阅 读 的 部 分 。 
如 果 不 知道 如 何 把 握 整 体内 容 ， 请 参考 接 下 来 的 专栏 “ 先 掌握 概要 再 阅读 细 
节 ”( 第 8 章 )， 试 试 里 面 介 绍 的 方法 吧 
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变量 和 函数 都 有 名 字 。 

名 字 是 如 何 产生 的 呢 ? 

本 章 将 阐述 名 字 和 作用 域 。 

作用 域 是 指名 字 的 有 效 范围 。 

那么 为 什么 要 对 名 字 的 有 效 范 围 作 出 限制 呢 ? 

本 章 我 们 将 回顾 作用 域 的 演变 历史 ， 学 习 名 字 和 作用 域 有 哪些 好 处 。 


为 什么 要 取 名 


程序 设计 中 ， 名 字 的 发 明 至 少 在 50 年 前 。 给 变量 和 函数 取 了 合适 
的 名 字 后 ， 程 序 的 可 读 性 显著 提高 。 由 于 大 部 分 语言 都 在 使 用 名 字 ， 现 
在 看 来 ， 取 名 似乎 是 理所当然 的 事 了 。 

那么 名 字 是 缘何 发 明 的 呢 ? 为 解答 这 个 问题 ， 我 们 反 过 来 想 一 下 。 
在 名 字 发 明 以 前 ， 程 序 员 是 如 何 指示 现在 那些 用 名 字 指 示 的 内 容 的 呢 ? 

答案 是 使 用 编号 “。 计 算 机 记录 数据 的 存储 位 置 可 以 用 编号 来 替代 ， 
于 是 有 了 “3456 号 的 数值 加 1” 这 样 的 计算 机 指令 。 

然而 ， 人 们 都 会 觉得 给 内 容 或 位 置 取 个 易于 理解 的 名 字 ， 并 用 该 名 
字 来 指示 它们 会 更 加 方便 。 比 如 ， 从 书架 上 取 书 时 ， 相 比 使 用 “取出 
3456 号 书 ” 或 者 “取出 ISBN 编号 为 978-4-8399-2282-5 的 书 ” 来 指定 ， 
“取出 《Python 程序 设计 》 这 本 书 ” 这 样 直接 使 用 名 字 的 指定 方法 要 方 
便 得 多 。 相 比 “ 把 12345 号 放置 的 内 容 移 到 98765 号 位 置 ", “把 果子 上 
的 信封 投入 家 门口 的 邮 简 中 ”这 种 说 法 简洁 明了 得 多 “。 因 此 ,程序 设计 


(D 也 叫做 存储 地 址 ， 即 指针 变量 中 的 内 容 。 

@ 同样 地 ， 相 比 “74.125.235.164 的 服务 器 ”来 说 , “google.com” 更 易于 理解 ， 故 
使 用 DNS。 相 比 “ 纬 度 35.693449” 来 说 “东京 都 新 宿 区 茶 街 ”更 容易 理解 ， 故 
使 用 居住 地 址 。 
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语言 也 逐渐 演变 为 使 用 名 字 来 指定 对 象 了 。 


| 怎样 取 名 

怎么 把 “取出 书架 左边 第 36 本 书 ” 的 说 法 转换 成 “取出 《 广 梧 
苑 议 呢 ?” 如 果 计 算 机 有 名 字 和 内 容 的 对 照 表 就 可 以 了 。 
{ 广 辞 苑 => 第 36 本 ,大 秤 林 -> 第 37 本 ， 新 明 解 国语 辞典 -> 第 38 本 } 

有 了 上 面 这 样 的 对 照 表 ， 计 算 机 在 接 到 “取出 《 广 辞 苑 沪 的 指令 
时 ， 就 可 以 理解 成 “原来 说 的 是 第 36 本 书 ”。 

用 Ruby 语言 代码 来 试 着 创建 x、y、z 三 个 变量 ， 如 下 所 示 : 


ea 


BB ,AJEedE le He 2152227000 


"Hello" 
BB ys GDoSGE le Hs 2152220380 


ZzZ 三 艾 


BB 号 < 四 Dj 人 GE le He 21952227000 


P 相当 于 其 他 语言 中 的 print， 其 输出 结果 写 在 注释 符 #=> 的 右边 。 
如 图 7.1 所 示 , x 和 z 这 两 个 名 字 是 与 2152227000 号 的 内 容 相 对 应 的 ， 
而 y 这 个 名 字 是 与 2152220380 号 的 内 容 相 对 应 的 。 


1 图 7.1 名 字 与 内 容 ( 对 象 ) 的 对 照 表 


因为 x 和 z 指 示 同 样 的 内 容 ,将 x 的 开头 改写 为 P 的 话 ，z 也 会 变 
成 Puby” 


(DD 这 样 讲 可 能 有 些 跑题 ， 将 这 个 例子 理解 为 “变量 就 是 盒子 ”的 话 ， 有 些 费 解 吧 。 
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[OI = up 
问 中 > 【BUY 
间 县 Ely 


‖ 名 字 冲 实 


早期 的 程序 设计 语言 中 ， 对 照 表 是 整个 程序 所 共有 的 ， 就 好 比 一 个 
公司 里 有 一 块 大 的 日 板 ， 大 家 都 在 上 面 做 记录 一 样 。 这 里 就 会 有 一 个 很 
大 的 问题 ， 我 们 举例 来 说 明 。 

下 面 的 代码 在 变量 i 的 值 从 0 逐 增 到 10 的 过 程 中 调用 函数 shori ”。 

EPE 


&shori().， 
站 站 和 


初 看 这 段 代 码 的 人 ， 可 能 会 党 得 这 里 的 for 语句 在 做 完 10 次 处 理 后 
会 终止 。 其 实 并 非 一 定 如 此 。 

如 果 在 函数 shori 中 不 小 心 使 用 了 i 这 个 名 字 会 怎样 呢 ?” 这 时 i 的 值 
就 被 改 号 了 。 下 面 的 例子 中 ， 每 次 孔 数 shori 被 调用 时 变量 i 的 值 都 被 重 
置 为 0，for 语句 不 管 循环 多 少 次 ， 变 量 i 都 不 会 变 为 10。 于 是 就 变 成 了 
无 限 循 环 。 


suum eae nl 


人 
Sa 0 


} 


| 如 何 避免 冲突 


前 面 提 到 的 “整个 程序 共用 一 个 对 照 表 ”， 也 就 是 说 ,， “变量 名 字 的 


@ 从 这 里 开始 ， 我 们 会 时 不 时 使 用 Perl 语言 的 代码 来 举例 说 明 ， 这 是 因为 Perl 语言 
是 可 以 使 用 很 多 种 作用 域 的 语言 。 
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有 效 范围 是 整个 程序 "。 这 种 情况 也 可 以 称 为 “该 变量 具有 全 局 作用 
域 "， 讲 得 更 简 清 一 些 ,“ 这 是 一 个 全 局 变量 "”。 全 局 变量 每 次 被 改写 它 
的 影响 会 波及 整个 程序 。 因 此 ， 在 函数 实现 时 不 得 不 考虑 其 调用 处 哪个 
名 字 的 变量 会 被 改写 。 上 面 的 例子 中 ， 因 为 函数 shori 中 使 用 了 调用 处 
同样 使 用 了 的 变量 i， 程 序 就 陷 人 了 无 限 循环 之 中 。 

要 防止 变量 名 不 小 心 重复 使 用 ， 即 要 防止 名 字 神 突 ， 该 怎么 做 呢 ? 


和 取 更 长 的 变量 名 

一 种 方法 就 是 取 更 长 的 变量 名 。shori 哺 数 中 不 要 使 用 i 这样 短 的 名 
了 字 ， 而 是 都 换 成 i_in_shori 这 样 的 名 字 ， 之 后 名 学 冲突 就 不 可 能 发 生 了 
吧 。 也 有 一 些 其 他 方法 ， 比 如 ， 在 多 人 共同 开发 的 项 目 中 ,采用 变量 名 
使 用 申请 制度 ， 或 者 在 变量 名 中 加 入 开发 者 的 名 字 ， 或 者 在 变量 名 中 加 
入 连续 的 编号 使 之 不 重复 。 


和 使 用 作用 域 

随 着 程序 规模 的 扩大 ， 防 止 名 字 冲 突 的 考量 也 变 得 艰难 起 来 。 没 
有 人 会 觉得 管理 变量 的 名 学 是 件 开 心 的 事情 。 没 有 其 他 更 好 的 方法 了 
吗 ? 于 是 为 一 种 使 用 作用 域 的 概念 的 方法 产生 了 。 下 一 市 我 们 来 学 习作 
用 域 。 


作用 域 的 演变 


作用 域 是 指名 字 的 有 效 范围 。 要 保证 程序 整体 不 会 出 现 名 字 冲 突 是 
件 困难 的 事情 ， 为 此 将 名 字 的 有 效 范 围 限 定 在 更 小 的 范围 之 内 ， 让 程序 
管理 变 得 轻松 一 些 。 作 用 域 的 提出 就 是 基于 这 个 考虑 。 前 面 讲 到 的 问题 
点 ， 就 是 在 函数 shori 中 名 字 i 所 赋 有 的 值 被 改写 的 情况 下 ， 会 给 其 他 部 
分 的 程序 带 来 影响 。 如 果 函 数 shori 中 的 名 字 i 仅 在 此 函数 中 有 效 就 好 
了 。 这 样 一 来 ， 就 只 需 关 注 i 在 函数 shori 中 的 情况 就 可 以 了 。 那 么 ,该 
如 何 实现 这 一 点 呢 ? 
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动态 作用 域 


由 如 何 操 作 

一 种 解决 方法 是 ， 把 变量 原来 的 值 事 先 保存 在 也 数 入 口 处 ， 在 出 口 
处 写 回 变量 中 。 
ED 


Su shoril 
$sold i = $i; © 
$i = 0; # 各 种 处 理 
$i = $01ld i; © 


函数 的 开头 把 变量 i 的 值 代入 变量 old i 中 (@ )， 函 数 结束 时 再 把 
变量 old i 中 的 值 返回 给 变量 i (@@。 这 是 一 种 先 把 原来 的 值 男 存 起 来 随 
后 返回 的 方法 。 如 此 一 来 ， 在 人 @ 和 @ 之 间 不 管 怎样 改写 $i 的 值 ， 对 其 
他 部 分 都 没有 任何 影响 。 

使 用 这 种 方法 ， 必 须要 注意 不 要 汤 写 返回 原来 的 值 的 那 一 行 @。 矣 
数 中 有 return 返回 时 ， 也 要 记得 先 把 变量 原来 的 值 返回 后 再 执行 return 
语句 。 凡 当 函 数 退 出 时 ， 所 有 地 方 都 要 毫 无 遗漏 地 加 上 返回 值 的 代码 “。 

然而 人 总 是 会 犯错 误 的 ， 对 于 这 样 的 任务 ,我 们 总 是 希望 能 让 计算 
机 去 完成 。 从 1991 年 发 布 的 Perl4 开始 ，Perl 语言 增加 了 这 一 功能 ， 通 
过 把 变量 声明 为 local 就 可 以 让 程序 处 理 器 去 承担 “把 原来 的 值 男 存 起 
来 随后 返回 ”的 任务 。 

ED 


SsuD horil 


local Si1; 


这 样 的 作用 域 称 为 动态 作用 域 。 


QD 从 函数 中 退出 时 保证 无 遗漏 地 执行 某 些 特 定 的 操作 ， 这 个 和 异常 处 理 结 合 在 一 起 
时 ， 会 变 成 一 个 复杂 的 话题 。 关 于 这 一 点 ， 第 6 章 有 详细 的 介绍 。 
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和 问题 点 

动态 作用 域 有 个 难以 处 理 之 处 ， 在 改写 了 变量 之 后 调用 其 他 函数 
时 ， 被 调用 的 函数 会 受到 影响 。 文 字 说 明 比 较 难 理解 ， 我 们 来 看 以 下 代 
但 ， 这 里 负数 yobu 调用 了 上 辣 数 yobareru。 
ED 


8 区 三 【GolLG5aLLDn 


SuUD OO 
LEGEal Ss = Xelouwn sy 
&yobareru () ; 


} 


sub yobarerul 
aedlmEe VONAYs 
# 十 输出 | yobu | 


&yobu () ; 


在 天 yob 中 ， 变 量 值 被 改写 为 yobu， 在 函数 yobareru 中 显示 变量 x 
时 ， 显 示 出 来 的 是 yobu。 束 是 说 ， 函 数 yob 中 的 变更 对 被 调用 的 冰 数 
yobareru 有 有 影 啊 。 

引入 了 动态 作用 域 后 ， 函 yobu 中 针对 变量 的 变更 对 全 局 变量 x 没有 
影响 ,但 是 这 个 变更 对 函数 yobu 里 进一步 调用 的 困 数 yobareru 有 影 啊 。 

动态 作用 域 中 被 改写 的 值 会 影响 到 被 调用 也 数 ， 因 此 在 引用 变量 时 
它 是 什么 样 的 值 ， 不 看 函数 调用 方 的 代码 这 个 是 无 从 得 知 的 。 而 逐 行 
去 看 调用 方 代码 会 很 碎 烦 。 这 里 举 的 例子 中 代码 较 短 ， 一 看 就 能 明 担 ， 
但 在 一 般 情况 下 ， 矣 数 在 哪里 被 调用 这 个 信息 分 散在 代码 中 ， 是 很 难 
把 握 的 “。 

这 个 问题 该 如 何 解 决 呢 ? 


山 反 过 来 ， 如 果 要 用 函数 调用 处 确定 的 值 来 改变 被 调用 函数 的 行为 该 如 何 实现 ? 参 
数 传递 是 一 种 方法 。 使 用 参数 传递 后 ， 读 代码 的 人 就 知道 这 个 变量 的 值 是 在 调用 
处 确定 的 。 
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部 态 作用 域 


在 全 局 作用 域 和 动态 作用 域 的 情况 下 ， 跨 越 程 序 整 体 的 变量 内 容 对 
照 表 为 多 个 函数 共用 ， 如 同 多 人 同时 作业 时 共用 日 板 一 样 。 因 此 ， 郴 数 
yobu 中 改写 的 内 容 也 能 立刻 被 晒 数 yobareru 读 取 到 。 改 写 的 值 能 被 读 取 
到 是 件 好 事 ， 但 同时 也 存在 不 希望 谈 取 到 改写 的 值 的 情况 。 这 就 是 动态 
作用 域 的 问题 点 。 该 如 何 解决 这 一 问题 呢 ? 

为 国 数 yobu 中 临时 使 用 的 变量 创建 的 变量 内 容 对 照 表 ， 被 放 在 了 
共用 的 空间 里 ， 因 此 大 家 都 能 该 取 到 。 如 果 不 这 样 做 会 怎样 ?” 即 每 调用 
一 个 函数 时 就 创建 新 的 对 照 表 。 就 像 大 家 每 个 人 都 使 用 各 目 桌 面 上 的 便 
签 纸 ， 而 不 是 在 共用 的 日 板 上 做 记录 一 样 。 

外 动态 作用 域 中 的 对 照 表 能 被 全 部 代码 读 取 

自 完 ， 我们 来 看 动态 作用 域 中 的 代码 行为 。 最 初 全 局 对 照 表 中 记录 
了 “x 等 于 global”( 图 7.2 )。 

1 图 7.2 写 入 全 局 对 照 表 
源 代码 


全 局 对 照 表 


x: global 


羡 数 yobu 中 也 使 用 了 相同 名 字 的 变量 x， 怎 么 做 到 不 改写 原来 的 全 
局 变量 x 中 的 值 呢 ? 之 前 我 们 讨论 过 ， 把 原来 的 值 通过 另 一 个 变量 名 保 
存 起 来 ， 之 后 再 写 回 原来 的 变量 名 ， 用 这 种 方法 可 以 解决 。 通 过 创建 新 
的 对 照 表 同样 可 以 解决 ( 图 7.3 )。 

使 用 动态 作用 域 定义 局 部 变量 x， 要 执行 以 下 三 个 操作 。 


e@ 进入 因数 yobu 时 ， 准 备 新 的 对 照 表 。 
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函数 yobu 写 入 变量 x 的 值 记录 在 该 对 照 表 中 。 
e 退出 也 数 yobu 时 ， 作 上 废 该 张 对 照 表 。 


和 图 7.3 ”动态 作用 域 下 ， 将 记录 写 入 一 张 全 局 可 见 的 新 的 对 照 表 中 


源 代码 


$x = "global' _ | [动态 作用 域 对 照 表 | | 全 局 对 照 表 
一 TN x: "yobu" x: "global' 
函数 yobu | 


local $x = yobu 


动态 作用 域 中 创建 的 对 照 表 可 以 被 全 体 的 源 代码 读 写 ， 这 是 和 静态 
作用 域 的 一 点 很 大 的 区 别 。 

执行 到 果 数 yobareru 中 参照 变量 x 时 ， 还 未 退出 也 yobu， 该 张 新 
的 对 照 表 还 有 效 。 于 是 程序 首先 读 取 这 张 新 的 对 照 表 ， 返 回 其 中 记录 的 
内 容 yobu ( 图 7.4 )。 需 要 访问 该 张 对 照 表 中 没有 记录 的 变量 时 ， 就 要 翻 
转 到 下 一 张 对 照 表 ， 也 就 是 全 局 对 照 表 进行 查找 。 


1 图 7.4 参照 变量 时 按照 由 近 及 远 的 顺序 读 取 


源 代码 


$x = "global' | | 动态 作用 域 对 照 表 | 】 全 局 对 照 表 
一 : Xx: "yobu" x: "global" 
由 近 及 远 的 ; 
顺序 读 取 


函数 yobareru 
print "sx" 


| EE 4 数 区 分 对 照 表 
个 函数 共用 一 张 对 照 表 ， 这 是 动态 作用 域 的 问题 扎 。 那 就 按 限 数 
来 区 分 对 照 表 吧 。 此 时 程序 执行 以 下 三 个 操作 。 


e 进入 滑 数 yobu 时 ， 准 备 函 数 yobu 专用 的 新 的 对 照 表 。 
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消 数 yobu 写 入 变量 x 的 值 记录 在 该 对 照 表 中 。 
e 退出 函数 yobu 时 ， 作 废 该 张 对 照 表 ”。 


在 也 数 yobu 中 改写 变量 x 的 值 时 ， 该 记录 被 写 人 图 数 yobu 专用 的 
对 照 表 中 (图 7.5 )。 


1 图 7.5 静态 作用 域 中 函数 各 自 的 对 照 表 


源 代 码 pr 名 字 和 值 对 照 表 


sx = "global' 全 局 对 照 表 


创建 新 的 对 照 : "global' 
函数 yobu yobu 局 部 对 照 表 人 
my $x = "yobu' X: Yobu 


随后 执行 到 函数 yobareru 中 参照 变量 x 时 ， 要 访问 的 不 是 呆 数 
yobu 专用 的 对 照 表 ， 而 是 函数 yobareru 专用 的 对 照 表 。 这 张 对 照 表 中 因 
为 没有 写作 消 数 yobu 改写 的 变量 值 ， 所 以 全 局 变量 的 值 会 被 谈 取 出 来 
(图 7.6 )。 

用 代码 来 表示 就 是 下 面 的 样子 。 


SS 三 GeGloa Du/ 


sub yobu{ 
my Sx = "yobu"; # 此 处 从 local 改 为 my 


&yobareru (); 


sub yobarerutl 


(DD 为 了 不 招致 误解 需要 说 明 一 下 。 ne 中 退出 前 ， 又 一 次 进入 函数 yobu 
的 情况 也 有 ， 这 时 会 如 何 ? 为 了 不 使 二 次 执行 给 首次 执行 带 来 影响 ， 需 要 为 二 次 
调用 创建 第 二 张 对 照 表 。 这 里 说 明 的 三 个 操作 是 在 没有 递归 调用 的 请 ee 函 
数 yobu 前 不 会 再 次 调用 函数 yobu。 但 一 般 情 况 下 存在 多 次 递归 调用 的 可 能 
这 就 需要 不 止 一 张 对 照 表 ， 而 是 要 为 每 次 函数 调用 配备 一 张 对 照 表 。 
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ai 


后 TSSS 


&yobu ( ) ; 
这 个 例子 实现 了 一 种 有 效 作 用 范围 ， 使 得 函数 yobu 中 的 变更 不 会 
影响 到 函数 yobu 之 外 的 部 分 。 它 借助 的 就 是 静态 作用 域 “。 
这 个 不 是 很 普通 吗 ? 佑 计 有 很 多 人 会 这 样 想 。 没 错 ! 现在 很 多 语言 
都 采用 了 静态 作用 域 。 


1 图 7.6 ”yobareru 本 地 没有 定义 名 字 x 故 读 取 全 局 变量 


源 代码 


sx = "global' 全 局 对 照 表 
! x: global 


试图 从 yobareru 作用 域 读 取 x 的 值 ， 但 发 现 没 有 ， 所 以 读 取 全 局 对 照 表 


相对 于 只 有 全 局 作用 域 的 状态 ,动态 作用 域 体现 了 一 种 进步 。 有 了 
动态 作用 域 ， 不 再 需要 担心 万 一 别处 也 使 用 了 名字 i， 也 不 再 需要 为 避 
免 冲 突 而 把 目 己 使 用 的 变量 名 写 在 稿 纸 上 ， 可 以 安心 地 使 用 简短 的 变量 
名 。 然 而 ,动态 作用 域 也 有 无 能 为 力 的 地 方 ， 为 解决 这 个 问题 开发 出 了 
静态 作用 域 。 

现在 说 全 局 变量 不 好 或 谈 避 人 免 全 局 污染 的 原因 就 在 于 此 。 但 是 ， 明 
明 有 减 小 作用 范围 的 标准 功能 不 用 而 致使 问题 产生 ， 这 有 是 非常 不 明智 的 。 


(D 静态 作用 域 也 叫 字 面 作用 域 (lexical scope )， 因 为 函数 yobu 中 创建 的 变量 的 有 效 
范围 ( 作用 域 ) 与 函数 yobu 在 字面 上 范围 是 一 致 的 。 
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PR 
静态 作用 域 是 完美 的 吗 


时 至 今日 ， 很 多 语言 都 选择 了 使 用 静态 作用 域 。 那 么 现在 的 静态 作用 
域 已 经 没有 改善 空间 ， 很 完美 了 吗 ? 不 是 的 。 还 有 一 些 尚 符 解 决 的 问题 。 


居 到 
其 他 语言 中 的 作用 域 


本 章 中 的 示例 代码 主要 是 用 Per| 语言 写 的 。 这 是 因为 ，Perl 语言 具有 
对 说 明 问 题 非 党 有 利 的 特征 ， 没 有 任何 声明 时 使 用 的 变量 为 全 局 变量 ， 市 
local 的 变量 为 动态 作用 域 ( 从 1991 年 的 Perl 4 开始 )， 训 my 的 变量 为 静 
态 作 用 域 ( 从 1991 年 的 Perl 5 开始 )。 现 在 执行 禁止 松弛 代码 的 use strict 
模式 时 ， 用 local 声明 的 动态 作用 域 变量 和 没有 包 的 全 局 变量 都 会 导致 编译 
错误 。 

其 他 语言 又 是 如 何 呢 ? 1958 年 问世 的 早期 LISP 语言 是 动态 作用 域 。 
1975 年 问世 的 作为 LISP 语言 的 一 种 的 Scheme 语言 采用 了 静态 作用 域 。 
1994 年 问世 的 JavaScript 语言 和 Perl 语言 一 样 ， 把 没有 任何 声明 的 变量 
视 为 全 局 作用 域 ， 把 用 var 声明 的 变量 视 为 静态 作用 域 。 而 1991 年 问世 的 
Python 语言 和 1995 年 问世 的 Ruby 中 ， 即 使 不 带 任 何 修饰 的 变量 也 被 视 为 
静态 作用 域 。 

在 以 后 的 程序 设计 中 ， 我 们 应 尽量 避免 使 用 全 局 对 照 表 这 种 大 家 共用 的 
空间 ， 而 去 使 用 那些 能 把 变更 的 影响 范围 减 小 的 方式 ， 写 出 便于 理解 的 代码 。 


我 们 以 从 一 开始 就 采用 静态 作用 域 的 Python 语言 为 例 来 说 明 。 在 
2000 年 发 布 的 Python 2.0 中 ， 对 照 表 〈 作 用 域 ) 有 三 个 层次 。 范 围 从 大 
到 小 ， 依 次 为 内 置 的 、 全 局 的 、 局 部 的 (图 7.7)。 人 简单 来 讲 ， 就 是 每 一 
个 程序 都 有 一 张 整 体 对 照 表 (内 置 对 照 表 )， 一 张 文 件 级 别 的 对 照 表 
(全 局 对 照 表 )， 一 张 图 数 级 别 的 对 照 表 (〈 局 部 对 照 表 )。 
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1 图 7.7 Python 语言 的 作用 域 的 三 个 层次 : 局 部 的 、 全 局 的 、 内 置 的 


本 地 对 照 表 
上. 本 地 对 照 表 | 


对 照 
全 局 对 照 表 


全 局 对 照 案 


本 地 对 照 表 
| 本 地 对 照 表 | 


Python 语言 的 内 置 作用 域 是 程序 的 任何 地 方 都 能 参照 到 的 对 照 表 ， 


比如 字符 串 孙 数 str 和 运行 时 错误 RuntimeError 这 样 的 。 因 为 这 有 包装 
好 的 函数 和 异常 ,所 以 被 称 为 内 置 ”。Python 语言 的 全 局 作用 域 是 针对 每 
个 文件 的 对 照 表 。 有 些 语言 也 称 其 为 文件 作用 域 。 局 部 作用 域 则 是 针对 
每 个 国 数 的 对 照 表 。 

Python 语言 是 赋值 即 变 量 定 义 的 语言 ， 它 没有 与 JavaSript 语言 的 
var x 和 Perl 语言 的 my $x 相当 的 变量 声明 。 执 行 也 数 中 的 赋值 ， 没 有 
任何 声明 语句 就 定义 了 局 部 变量 。 也 就 是 说 ， 想 要 在 男 数 中 为 某 数值 取 
名 字 ， 只 需 把 数值 赋值 给 你 喜欢 的 名 字 的 变量 。 这 样 做 不 会 对 函数 以 外 
的 部 分 产生 任何 影响 。 

乍 一 看 ， 这 似乎 是 百 利 无 害 的 大 好 事 。 然 而 人 们 设计 的 东西 不 管 看 
起 来 是 多 么 地 正确 ， 往 往 还 是 会 有 错误 的 地 方 。 现 在 看 来 ， 这 种 机 制 至 
少 有 两 个 问题 。 


嵌 套 函数 的 问题 
第 一 个 问题 就 是 看 似 骨 套 结构 体 的 作用 域 其 实 并 非 是 艇 套 结构 体 。 


语言 也 可 能 将 其 称 为 全 局 的 。 如 我 们 之 前 反复 强调 的 一 个 要 点 ， 关 键 字 用 语 
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Python 语言 文 持 把 函数 作为 车 套 结构 体 即 晒 数 舱 套 ， 盯 数 中 允许 定义 新 
的 本 数 。 下 面 的 代码 中 ， 郴 数 foo 中 定义 了 函数 bar， 来 显示 x 的 值 。 


3 吾 SG 汕 人 DLL 
def foo(): 
Se WB 
def bar(): 
print x © 
bar () 
EO@D() 


这 名 print 语句 要 输出 的 值 很 直观 吗 ?认为 输出 foo 的 人 应 该 不 在 少 
数 吧 。 然 而 ， 到 Python 2.0 情况 都 不 是 这 样 。 这 名 代码 输出 为 global 
(图 7.8 )。 


1 图 7.8 容易 误 认为 是 使 用 代码 上 相近 的 定义 


# Python 

X= global 

def foo!(): 
le + ) 
def bar(): 

print x 9 

bar() 

foo() 


这 是 什么 情况 ? 从 源 代 码 表面 上 看 ， 因 为 函数 foo 中 包含 函数 bar， 
所 以 很 多 人 会 以 为 图 数 foo 的 作用 域 中 也 包含 水 数 bar 的 作用 域 。 这 就 
是 说 ，bar 的 作用 域 中 找 不 到 名 字 x 时 ， 参 照相 邻 外 部 的 foo 的 作用 域 ， 
抱 有 这 种 想法 的 人 很 多 (图 7.9 @ )。 

实际 上 Python 2.0 的 设计 并 不 是 这 样 的 。 函 数 bar 的 局 部 作用 域 中 
找 不 到 名 字 x 时， 接 下 来 去 找 的 是 全 局 作用 域 (图 7.9 @ ), 

这 种 程序 设计 囊 来 了 很 多 误解 ， 并 且 有 时 会 招致 一 些 奇 怪 的 解决 偏 
方 ”: 因此 ， 认 识 到 这 是 一 个 需要 修正 的 问题 后 ，2011 年 发 布 的 Python 
2.1 已 经 把 设计 修改 为 @@ 指 示 的 逻辑 。 


QD 利用 函数 参数 的 默认 值 在 函数 定义 时 确定 的 特点 ， 写 成 bar(x=x) 的 形式 把 foo 的 
作用 域 中 的 X 值 带 入 bar 的 作用 域 。 说 的 是 这 种 解决 方法 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


7.3 ”静态 作用 域 是 完美 的 中 “| 91 


1 图 7.9 ” 藤 套 结构 体 作 用 域 的 解释 : 想像 ( @ ) 与 Python 2.0 中 的 现实 ( @ ) 


相 灸 的 二 
de 全 局 对 照 表 
函数 foo 对 照 表 foo 证 二 "global' 
x = "foo" 


函数 bar 对 照 表 bar x= foo 
print x bar = <function> 


现实 的 
本 全 局 对 照 表 
消 数 foo 对 照 表 foo x = "global" 
x To0 


函数 bar 对 照 表 bar x= foo 
print x bar = <function> 


i 外 部 作用 域 的 再 绑 定 问题 


第 二 个 问题 是 无 法 变更 能 套 作用 域外 部 的 变量 。 这 个 问题 起 因 是 
Python 语言 赋值 即 变量 定义 的 特点 。 函 数 中 执行 变量 赋值 语句 时 ， 这 个 
变量 就 成 为 该 函数 的 局 部 变量 。 赋 值 带 来 的 操作 是 ， 当 这 个 作用 域 中 有 这 
个 名 字 的 变量 时 ， 对 该 名 字 的 变量 进行 再 次 绑 定 "， 当 这 个 作用 域 中 没有 这 
个 名 字 的 变量 时 ， 定 义 一 个 新 的 局 部 变量 。 不 管 哪 种 情况 ， 这 对 于 外 部 的 
作用 域 来 说 都 没有 影响 。 也 就 是 说 ， 无 法 变更 此 作用 域外 部 的 变量 。 
GETD 
def foo(): 


Wolo 


def bar(): 


站 三 MMEwWY 

# 打算 修改 外 面 的 x 的 值 

# 却 创建 了 一 个 新 的 本 地 变量 
bar () 


全 LL 忆 实 


foo() #-> old (没有 能 修改 ) 


中 绑 定 , 简 单 来 讲 就 是 将 名 字 和 值 关 联 在 一 起 。 再 绑 定 也 就 是 对 变量 x 关 联 另 外 的 值 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


92 | 第 7 章 名 字 和 作用 域 


和 Python 语言 中 的 解决 方法 

对 于 如 何 解 决 这 一 问题 ， 曾 经 有 过 非常 激烈 的 讨论 。 大 家 提出 的 方 
案 中 ， 有 像 JavaScript 语言 那样 在 变量 定义 的 作用 域 中 用 var 来 做 声明 
的 方法 。 这 一 方法 确实 能 解决 这 个 问题 ， 但 是 相应 的 失去 了 与 过 去 的 代 
但 的 互 换 性 。 所 以 ， 这 种 方法 是 不 可 取 的 。 

直到 2006 年 Python 3.0 中 才 出 现 了 一 种 方法 ， 即 在 函数 开始 时 声明 
变量 为 nonlocal 性 质 。 

nonlocal 这 个 关键 字 的 选取 也 是 在 众多 备 选 项 中 挑选 出 来 的 ， 因 为 
它 出 现 的 频 度 在 过 去 代码 中 是 最 低 的 。 


def foo(): 


EGR 
def bar(): 
nonlocal x # 非 本 地 变量 声明 
x = "new" # 修改 外 部 作用 域 
bar () 


Ba (es) 


foo () #-> new ( 变量 修改 了 ) 
外 Ruby 语言 中 的 解决 方法 

Ruby 语言 也 是 一 种 不 和 需要 对 变量 进行 声明 的 语言 ， 所 以 它 面 临 与 
Python 同样 的 问题 。 

Ruby 语言 中 像 函 数 这 样 发挥 作 用 的 有 两 种 ,方法 和 代码 段 
(Block )。 在 Ruby 1.9 版 本 中 ,方法 在 进行 舱 套 时 作用 域 是 不 藤 套 的 
(@,)., 


GE EGGYN 


uusee 
erDare # 方法 岁 套 
加 葡 #-> 出 错 ， 无 法 访问 外 部 的 x (@) 


end 


(D “PEP3104 -- Access to Names in Outer Scopes”, http:/www.python.org/dev/peps/pep-3104/ 
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bar() 
end 


EGG1 


男 外 ， 当 方法 中 含有 代码 段 时 ， 方法 的 局 部 作用 域 中 有 的 名 字 在 代 
码 段 中 被 视 为 方法 的 局 部 变量 ， 除 此 以 外 的 被 视 为 代码 段 的 局 部 变量 “。 
这 也 就 是 说 ， 在 代码 段 中 对 变量 赋值 时 可 能 发 生 一 种 情况 ， 即 原本 想 定 
义 一 个 局 部 变量 ， 却 因为 与 外 部 作用 域 中 的 名 字 重 复 ， 无 意 中 造 成 了 变 
量 值 的 变更 。 在 这 方面 需要 特别 注意 。 检 查 是 否 使 用 了 相同 名 字 的 变量 
在 这 里 并 不 怎么 困难 ， 因 为 需要 检查 到 的 范围 只 有 一 个 方法 。 

Ruby ) 
def foo() 

x = "old" # foo 方 法 的 作用 域 中 有 变量 名 x 

lambda {x = "new'"; y = "new"}.call # 在 方法 中 创建 代码 段 

# x 是 方法 foo 的 、y 是 方法 lambda 的 本 地 变量 

ex #- > 修改 成 为 new 

p y  #-> 出 错 ，y 是 lambda 的 本 地 变量 此 处 无 法 访问 


end 


foo # 调用 foo 


/.4 
小 结 


本 章 我 们 学 习 了 对 名 字 的 有 效 作 用 范围 进行 限制 的 重要 性 。 现 在 
(2013 年 ) 大 量 采 用 的 是 静态 作用 域 。 

变量 在 任何 一 种 语言 中 都 存在 ， 但 不 能 想当然 认为 它 在 任何 语言 
都 是 一 样 的 ， 或 者 它 从 一 开始 就 是 现在 这 样 的 。 事 实 上， 语言 的 不 同 会 
带 来 各 种 差异 ， 即 使 现在 大 家 还 在 不 断 地 进行 各 种 讨论 以 寻求 更 好 的 处 
理 方 式 。 本 草 介 绍 了 Ruby 1.9 和 Python 3.0 中 对 变量 作 变 更 的 例子 。 

虽然 现在 很 少 会 使 用 动态 作用 域 , 但 这 一 概念 并 不 是 完全 没有 用 


(D 像 在 foo{lx,y; zz|...} 中 这 样 ， 通 过 前 置 的 分 号 来 强制 z 成 为 局 部 变量 。 
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处 。 与 静态 作用 域 中 作用 域 是 源 代 码 级 别 上 的 一 块 完整 独立 的 范围 不 
同 ， 在 动态 作用 域 中 ， 作 用 域 则 是 进入 该 作用 域 开始 直至 离开 这 一 时 间 
轴 上 的 完整 独立 的 范围 。 与 此 相同 的 特征 也 体现 在 其 他 好 多 地 方 。 比 
如 ， 在 某 处 理 进行 期 间 ， 一 时 改变 某 变量 的 值 随后 将 原 值 返回 的 代码 编 
写 方式 就 相当 于 创建 了 自己 专属 的 动态 作用 域 。 又 如 ， 异 常 处 理 与 动态 
作用 域 也 很 相似 ， 函 数 抛 出 异常 时 的 处 理 方式 受到 调用 函数 的 try/catch 
语句 的 影响 。 

面向 对 象 中 像 private 声明 这 样 的 访问 修饰 符 ， 在 限制 可 访问 范围 的 
作用 上 和 作用 域 是 非常 相似 的 。private 将 可 访问 范围 限制 在 类 之 内 ， 而 
protected 将 此 施 围 扩 大 到 其 继承 类 。 这 和 子 数 调用 处 的 变更 会 影响 到 调 
用 里 面 的 操作 这 一 动态 作用 域 表 现 是 相似 的 ， 两 者 都 具有 这 么 一 个 缺 
点 ， 这 就 是 影响 范围 没有 能 限制 在 代码 的 某 一 个 地 方 。 

比如 Java 语言 ， 它 是 静态 作用 域 语言 ， 它 的 类 可 以 在 源 代 码 的 任意 
处 被 访问 。 这 意味 着 类 是 具有 全 局 作用 域 的 。 但 是 类 的 名 字 具 有 层次 并 
且 只 有 导入 后 才能 被 使 用 ”， 这 如 免 了 全 局 变量 带 来 的 无 意 的 名 字 冲 突 。 
但 是 不 管 是 全 局 变量 还 是 类 的 静态 成 员 都 可 以 在 源 代码 的 任意 地 方 被 变 
更 。 这 提醒 我 们 ， 在 享受 使 用 上 的 便利 的 同时 ， 要 谨防 滥用 导致 的 代码 
难以 理解 的 情况 发 生 “。 

作用 域 是 编写 易于 理解 的 代码 的 有 力 工 具 ， 很 多 地 方 都 应 用 了 这 一 
概念 。 


(D java.lang 这 样 的 包 里 的 类 除外 。 
@ 对 于 习惯 了 java 语言 设计 模式 的 人 ， 这 样 说 或 许 传达 更 清楚 些 : 不 要 把 单 例 模式 
( singleton pattern ) 作为 全 局 变量 的 替代 来 使 用 。 
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本 章 我 们 来 学 习 类 型 。 

但 一 下 子 就 进入 类 型 的 学 习 ， 大 家 也 许 会 觉得 过 于 抽象 。 

在 具体 学 习 类 型 的 必要 性 前 ， 我 们 先 来 了 解 一 下 数 的 表达 。 

以 数 的 表达 为 例 学 习 了 类 型 的 必要 性 后 ， 我 们 了 解 到 类 型 被 用 来 达成 各 
种 不 同 的 目的 。 


什么 是 类 型 


类 型 是 什么 ? 这 很 难 讲 。 要 是 抽象 地 来 解释 想必 效果 也 一 般 “。 

类 型 是 人 们 给 数据 附加 的 一 种 追加 数据 。 计 算 机 中 保存 的 数据 是 由 
on 和 off 或 0 和 1 的 组 合 来 表达 的 “。 至 于 on 和 of 的 组 合 (比特 列 ) 是 
如 何 表 达 各 种 数值 的 ， 哪 种 比特 列表 示 哪 种 值 ， 这 些 只 不 过 是 人 们 简单 
的 约定 事项 而 已 。 同 样 的 比特 列 ， 当 其 被 解释 为 的 数据 的 类 型 不 同时 ， 
得 到 的 数值 是 不 同 的 。 为 了 避免 这 一 情况 的 发 生 ， 人 们 追加 了 关于 数据 
的 类 型 信息 ， 这 就 是 类 型 的 起 源 。 

为 了 把 类 型 的 意义 具体 化 ， 本 章 我 们 先 来 学 习 整 数 和 小 数 是 如 何 用 
比特 列 来 表现 的 。 随 后 ， 我 们 会 看 到 模样 相同 的 比特 列 可 能 值 是 不 同 
的 ， 而 如 果 把 类 型 搞 错 了 ， 将 无 法 进行 计算 。 最 后 ， 在 探讨 了 类 型 作 
为 保证 不 出 错 的 方法 的 必要 性 之 后 ， 我 们 来 谈 谈 类 型 后 来 是 如 何 发 展 
演化 的 。 


QD) 数学 家 伯 特 兰 . 罗素 (Bertrand Russell ) 注意 到 对 集合 的 定义 会 产生 悖 论 ， 为 了 
回避 这 一 问题 ， 他 提出 了 类 型 理论 。 如 果 这 样 抽象 地 介绍 ， 大 家 能 理解 么 ? 

@ 既 有 把 数据 当做 连续 量 处 理 的 模拟 计算 机 ， 也 有 按照 10 进 制 计算 的 ENIAC， 这 
里 不 多 深入 介绍 。 
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$.2 
数值 的 on 和 off 的 表达 方式 


如 何在 电子 计算 机 中 表达 数值 呢 ? 如 前 所 述 ， 在 计算 机 中 所 有 的 数 
值 都 用 on 和 off 或 0 和 1 的 组 合 来 表达 。 为 了 更 形象 地 说 明 ， 我 们 换个 
角度 来 思考 ， 该 如 何 用 灯泡 的 点 亮 与 熄灭 来 表达 数值 呢 ? 

最 简单 的 方法 就 是 ， 要 表达 3 这 个 数字 时 点 亮 三 蔓 灯 。 然 而 在 这 种 
方式 之 下 ， 需 要 有 与 希望 表达 的 数字 相当 数量 的 灯泡 ， 如 有 果 想 表达 0 到 
999 之 间 的 数 ， 就 要 准备 999 芒 灯 泡 (图 8.1 )。 有 没有 用 更 少 的 灯泡 数 
量 来 表达 数字 的 方式 呢 ? 让 我 们 追溯 到 计算 机 诞生 以 前 ， 来 看 看 那 时 数 
字 是 如 何 表达 的 。 


1 图 8.1 点 亮 与 欲 表达 数字 相当 数量 的 灯泡 ( 黑 圈 表示 点 亮 的 灯泡 ) 


CO 六 一 吕 


| 数位 的 发 明 


在 计算 机 诞生 前 一 千 多 年 ,人 类 发 明了 数位 计算 法 “。 这 种 方法 通过 
在 每 一 位 上 使 用 0 到 9 这 十 个 记号 中 的 一 个 来 表达 数字 。 比 如 表达 五 百 
六 十 七 这 个 数 时 ， 考 虑 到 百 位 是 $S， 十 位 是 6， 个 位 是 7， 于 是 把 $、6、 
7 三 个 数字 并 列 在 一 起 。 按 照 同样 的 方法 ， 要 表达 0 到 999 之 间 的 数 ， 
只 需要 百 位 的 9 个 、 十 位 的 9 个 、 个 位 的 9 个 ， 总共 27 莹 灯泡 即 可 


由 发 明 于 印度 ， 途 经 阿拉 伯 国 家 传 到 欧洲 ， 因 此 后 来 被 称 为 阿拉 伯 数 字 。 有 一 本 年 
代 可 考 的 著作 是 花 刺 子 模 ( al-khwarizmi ) 于 公元 825 年 写 的 《印度 数 的 计算 法 》， 
这 是 关于 数位 最 古老 的 记载 。 值 得 一 提 的 是 ，al-khwarizmi 这 个 词 在 拉丁 语 里 被 
记 为 Algoritmi， 这 就 是 现在 英语 中 算法 ( Algorithm ) 的 词 源 。 
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(图 8.2 )“。 通 过 数位 的 使 用 , 所 需 的 灯泡 数 从 999 个 又 降 至 27 个 , 那么 
还 有 没有 能 继续 减少 灯泡 数量 的 方法 呢 ? 
和 图 8.2 百 位 、 十 位 、 个 位 


723 
OOSBS88888 百 位 
OOOOCCCOS@@ 十 位 
O00000@@® 个 位 


| 七 段 数 码 管 显示 器 

在 计算 机 诞生 之 前 ， 人 们 早 就 发 明了 每 一 数位 用 七 费 灯 泡 来 表达 数 
字 的 方法 。 大 家 肯定 都 在 日 常生 活 中 见 过 它 ， 这 就 是 常 使 用 于 电子 计算 
器 等 领域 的 显示 数字 的 七 段 数码 管 显示 器 (图 8.3, 图 8.4 ) 2。 


和 图 8.3 七 段 数 码 管 显示 器 


图 例 


0 cc88@ 0 OO88808 
1 OOOOO®® 6 8 和 @ 
2 DSS 7 OOSOO@® 
3 CD@e@@8@ 3 G600889 
4 人 一 S@ 9 8@ 


由 为 什么 是 9 个 而 不 是 10 个 呢 ? 这 是 因为 ， 全 部 灯泡 熄灭 能 表达 0 而 全 部 点 亮 能 
表达 9，9 益 灯 泡 足 以 表达 10 个 数字 了 。 

@ 七 段 数码 管 显示 器 出 现 的 年 代 很 早 ， 在 1908 年 美国 的 专利 申请 中 能 发 现 相 关 记 
录 一 一 专利 第 974、943 号 : http:/www.google.com/patents?vid=974943 
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通过 使 用 七 段 数 码 管 显示 硕 ， 用 七 慢 灯 泡 就 可 以 表达 一 位 上 面 的 
数字 ， 表 达 三 位 的 数字 所 需要 的 灯泡 数量 变 为 21 个。 这样 一 来 又 减少 
本 bes 


| 算 盖 


实际 上 还 可 以 继续 节省 灯光 数量 。 可 以 做 到 只 用 5 茶 灯 泡 来 表达 一 
位 上 面 的 数字 ， 这 个 实例 就 是 算盘 (图 8.5、 图 8.6) “"。 

算盘 是 通过 算 珠 的 位 置 来 表达 信息 的 。4 个 算 珠 用 来 表达 0 到 4 的 
数字 ， 另 外 一 个 算 珠 用 来 表达 是 否 需要 再 加 上 5 这 一 信息 。 在 算盘 这 种 
表达 方式 中 ， 用 5 蒂 灯 泡 就 可 以 实现 一 位 上 数字 的 表达 ， 表 达 三 位 的 数 
字 所 需要 的 灯泡 数量 变 为 15 个 。 这 样 又 进一步 减少 了 6 个 。 
1 图 8.5 算盘 


百 位 “十 位 个 位 


0 OOOOO 9 Coo 
1 O@OOO 6 ©@8O0O 
2 O80O0O / cc 
3 OB88O 8 8 
4 OB 9 ©8880 


() 顺便 提 一 下 ， 英 语 中 的 计算 一 词 calculate， 它 的 词 源 是 拉丁 语 中 表达 算盘 中 的 算 
珠 的 词 calculus。Calcium ( 钙 ) 一 词 的 词 源 同样 来 自 于 此 。 
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至 此 ， 我 们 看 到 了 表达 数字 的 不 同方 法 。 它 们 之 中 有 的 需要 的 灯泡 
数量 多 ， 有 的 需要 的 灯泡 数量 少 。 那 么 所 需 灯 泡 数 量 最 少 的 方法 是 什么 
呢 ? 理论 上 最 少 又 能 少 到 什么 程度 呢 ? 

一 费 灯 泡 能 表达 两 种 不 同 的 符号 ， 那 么 两 斑 灯 泡 就 能 表达 4 种 不 同 
的 符号 。 相 应 地 ， 三 贰 就 是 8 种 。 这 还 不 够 表达 0 到 9 之 间 的 10 个 不 
同 符号 ， 因 此 ， 一 个 数位 上 三 菩 灯 泡 是 不 够 的 。 有 四 薪 灯 泡 的 话 ， 就 可 
以 表达 16 种 不 同 符号 了 ， 当 然 也 就 足够 表达 0 到 9 之 间 的 10 种 符号 。 

事实 上 ， 早 期 的 计算 机 ， 比 如 UNIVACI 就 是 使 用 了 四 带 灯 泡 表达 
数值 的 方法 。 该 方法 被 称 为 excess-3 (加 三 码 ) (图 8.7 )。 使 用 这 种 方法 
总 共 需 要 12 带 灯 泡 就 可 以 表达 0 到 999 之 间 的 数 “。 


1 图 8.7 Excess-3 中 ， 黑 圈 表 示 1， 白 圈 表 示 0 


0 OO@® 
1 O@OO 
2 OBO® 
3 O@eO 
4 CS 


和 


| 从 十 进 制 到 二 进 制 


然而 ， 四 蓄 灯 光明 明 足 够 表达 16 种 符号 的 ， 而 只 使 用 了 其 中 的 10 
种 符号 ， 这 总 让 人 和 党 得 有 点 滔 费 。 有 没有 更 加 精打细算 的 方法 呢 ? 

这 和 十 进 制 的 差别 在 于 十 进 制 中 一 个 数位 可 以 表达 10 个 符号 。 有 既 
然 一 蒂 灯 泡 只 能 表达 两 种 不 同 的 状态 ， 那 么 进位 也 与 之 相 适 应 ， 着 二 
进 一 位 ， 这 样 做 会 怎样 呢 ?” 也 就 是 说 ,不 再 是 个 位 、 十 位 、 百 位 、 二 


QQ) Excess-3 中 针对 0~9 中 的 任意 一 个 数 Xx，9 减 去 xX 得 到 的 数 和 表达 xX 的 四 萎 灯 泡 反 
转 后 的 数 是 相同 的 。 因 为 它 具 有 这 样 的 特征 ,用 Excess-3 来 制作 减法 电路 十 分 方便 ， 
这 是 这 种 符号 得 到 普及 的 理由 之 一 。 
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位 这 样 地 进位 ， 而 是 1 位 、2 位 、4 位 、8 位 这 样 地 进位 。 这 就 是 二 进 制 
(图 8.8 )。 


1 图 8.8 4 过 灯 泡 表达 16 种 不 同 的 符号 


8421 8421 
0 bood 8 euod 8 
1 OOO® 1 9 © O03 十 1 
2 OO@O 2 10 ©@O8O 8 +2 
3 OO@® 2+1 11 ©@O8® 3 +2+1 
O@OO 4 12 @@OO 8+4 
5 O@O® 4 + 1 13 @SC@ 8+4 +1 
6 O@@O 4+2 14 @@@O 383+4+2 
/ O@8®@ 4+2+1 15 ©@@88@® 3 +4+2+1 


使 用 二 进 制 后 ，10 药 灯 泡 就 能 表达 0 到 1023 之 间 的 数字 了 (图 
8.9 )。1023 等 于 1+2+4+8+16+32+64+128+256+512。 上 一 小 节 讲 的 十 进 
制 中 ， 要 表达 0 到 999 之 间 的 数 12 瘤 灯 泡 已 经 是 极限 了 。 可 见 使 用 二 
进 制 后 数 的 表达 效率 能 得 到 进一步 提高 “。 


1 图 8.9” ”二进制 中 10 营 灯 泡 表 达 1000 


dil2 641161411 
250128 2 8B 之 


vi 641161411 
2500128 32 © 2 


D512+256+128+64+32+8=1000 


在 实际 的 计算 机 中 表达 整数 时 使 用 了 多 少 灯泡 呢 ? 

1983 年 , 由 任天堂 推出 的 家 庭 计算 机 中 使 用 了 8 蒿 灯泡”, 能 表达 的 
整数 范围 是 0~255。 正 因 如 此 ， 有 些 游戏 中 计数 器 到 255 时 就 会 停止， 
有 些 游戏 在 有 数值 超过 255 时 会 发 生 程序 错误 。 

笔者 撰写 这 本 书 时 是 2013 年 。 时 至 今日 ，PC 机 使 用 32 菩 或 64 芒 


(D 和 十进制 中 的 每 一 位 大 概 需要 3.32 个 灯泡 即 可 ， 即 log(10)/log(2)。 
@ 严格 来 讲 是 使 用 了 和 八 位 的 CPU。 
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灯泡 已 经 成 为 主流 "。32 芒 能 表达 0~4 294 967 295 之 间 的 数 , 64 芒 能 
达 0~18 446 744 073 709 551 615 之 间 的 数 。 


| 八进制 与 十 六 进 制 


另外 ， 作 为 表达 数值 的 方法 还 有 八进制 与 十 六 进 制 。 这 些 又 是 怎么 
回 事 呢 ? 话 已 至 此 ， 我 们 一 起 来 讲解 一 下 八进制 与 十 六 进 制 。 

大 家 平时 使 用 的 是 十 进 制 。 在 十 进 制 中 ， 每 个 位 上 使 用 的 是 0 到 9 
之 间 的 十 个 符号 。 刚 刚 我 们 学 习 的 二 进 制 中 ， 每 一 位 上 仅仅 使 用 0 和 1 
两 个 符号 。 相 比 十 进 制 ， 二 进 制 在 使 用 的 符号 种 类 更 少 的 同时 ， 表 达 相 
同 的 数字 时 所 需要 的 字符 数量 也 更 多 。 比 如 十 进 制 中 的 1000 在 二 进 制 
中 表达 就 是 1111101000， 这 个 也 太 长 了 ， 访 起 来 比较 困难 。 

把 二 进 制 中 某 几 个 字符 组 合 在 一 起 用 一 个 字符 来 表示 ， 使 之 变 得 更 
容易 读 ， 这 种 表达 方式 就 是 八进制 或 十 六 进 制 。 
N 进 制 中 使 用 的 字符 

二 进 制 0 1 

八进制 

十 进 制 
十 交 进 制 
和 八进制 

例如 把 二 进 制 数 1111101000， 每 三 位 三 位 进行 切 分 就 变 成 001 111 
101 000。 这 样 切 分 后 ， 每 一 小 块 有 2 x 2 x 2 总 计 8 种 模式 。 将 这 二 进 制 
中 的 三 个 学 符 通过 以 下 表 中 的 蔡 换 形式 各 上 自 蔡 换 为 一 个 字符 后 ， 得 到 的 
是 1750。 


Oli234 和 4567 
0 1L232597 8 9 
四 站 马 电 和 人 7I 久 9 晶 有 DGdC 


000 > 0 001 = 一 ”二 010 一” 2 O11l > 3 
100 一 4 OM > 3 下 让 人 >” ll 


这 里 每 一 位 可 能 使 用 八 种 符号 ， 所 以 被 称 为 八进制 。 


QQ) 内 置 有 64 位 CPU 的 PC 机 在 一 般 的 数码 城 就 可 以 买 到 了 ， 当 然 也 有 很 多 人 还 在 
使 用 老式 32 位 CPU 的 PC 机 。 
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和 十 六 进 制 

再 如 ， 把 同样 的 二 进 制 数 ， 按 每 四 位 四 位 的 切 分 方法 ， 得 到 的 是 
0011 1110 1000. 这 样 切 分 后 ， 每 一 小 块 有 2x2x2 总 计 16 种 模式 。 将 
这 二 进 制 中 的 四 个 字符 通过 以 下 表 中 的 符 换 形式 各 目 奉 换 为 一 个 字符 
后 ， 得 到 的 是 3e8。 


Q000 一 OO 二 汪 O0010 > 2 OO 
0100 一 4 gl101 一 与 0110 一 ”> 人 Ol 一 > 7 
O00 > 8 O00 = 9 0i0 = a L011 > 19 
0 ee i110l —— ji0 一 > 全 I 


这 里 每 一 位 可 能 使 用 十 六 种 符号 ， 所 以 被 称 为 十 六 进 制 。 习 惯 
通常 在 八进制 表示 的 数值 前 加 上 0 或 00， 十 六 进 制 表示 的 数值 前 加 
上 0x, 

ve 


> 0 s0 
O00 
>>> Ox3e8 


O00 


86.4 
如 何 表 达 实 数 


至 此 ， 我 们 学 习 了 用 灯泡 的 点 亮 和 熄灭 来 表达 整数 ”的 方法 。 接 下 
来 ， 我 们 来 探讨 如 何 表达 1.5、0.001 这 样 融 有 小 数 点 的 实数 。 


定点 数 一 小 数 点 位 置 确定 


一 种 方法 是 确定 小 数 点 的 的 位 置 。 比 如 ， 约 定好 把 整数 的 小 数 点 问 


(DD 以 0 开始 的 数值 ， 比 如 ， 在 C、Ruby、Python 等 很 多 语言 中 ，0100 都 被 当 作 是 入 
进 制 数 。 但 是 ， 也 有 批评 意见 认为 这 样 的 表达 方式 容易 被 误 认 为 是 100. Python 语 
言 从 3.0 版 本 开始 把 0100 作为 语法 错误 ， 强 制 要 求 其 表达 为 00100. 

@ 目前 还 没有 接触 到 负数 的 表达 方式 ， 严 格 来 讲 这 里 说 的 是 非 负 的 整数 。C 语言 中 ， 
这 种 类 型 叫做 无 符号 整数 型 (unsigned int )。 
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左 移动 四 位 ， 最 低 四 位 就 是 小 数 部 分 。 这 样 一 来 ，1 变 成 0.0001，100 
变 成 0.0100 即 0.01. 

这 种 方法 有 个 问题 ， 它 无 法 表达 比 0.0001 小 的 数 ， 比 如 无 法 表达 
0.00001。 当 然 只 要 把 约定 改 为 把 整数 的 小 数 点 问 左 移动 五 位 得 到 小 数 部 
分 就 可 以 ,但 这 样 针 对 每 一 个 新 的 小 数 都 要 记 一 句 新 的 约定 很 困难 ， 而 
日 还 容易 出 错 。 

那 该 怎么 办 呢 ? 


| 浮 点 数 一 数 值 本 身 包含 小 数 部 分 何 处 开始 的 信息 


把 人 们 很 难 记忆 的 问题 交 给 计算 机 去 做 就 解决 了 了， 证 数值 本 身 包含 
何 处 开始 为 小 数 部 分 的 信息 就 好 了 。 


和 这 是 怎样 一 种 思考 方法 


假如 用 16 车 灯泡 来 表达 小 数 ，16 营 中 的 10 蔓 可 以 表达 0~1023 之 
间 的 数 ， 这 是 三 位 有 效 数字 的 信息 ; 其 余 的 6 俐 灯 可 以 表达 0~63 之 间 


的 数 ， 用 来 表达 小 数 点 的 位 置 。 

这 种 方法 不 仅 可 以 表达 小 的 数 也 可 以 表达 大 的 数 。 如 果 把 所 有 位 数 
都 用 来 表达 整数 ，16 芒 灯 全 部 用 上 ， 最 多 只 能 表达 6 万 多 的 数 。 把 表 
达 小 数 点 位 置 的 范围 0~63 减 去 33， 得 到 -33~30 这 一 范围 。 把 -1 的 
定 为 小 数 点 向 左 移动 一 位 ， 即 除 以 10，+1 约定 为 小 数 点 向 右 移动 一 位 
即 乘 以 10。 这 样 一 来 ， 这 种 方法 可 以 表达 1023 后 面 再 跟 30 个 零 这么 
大 的 数 ”。 

这 就 是 现在 一 般 使 用 的 浮 点 数 的 基本 思想 。 上 一 小 节 讲 的 确定 小 数 
点 位 置 的 方法 被 称 为 定点 数 ， 这 个 方法 中 的 小 数 点 是 动 的 ， 所 以 被 称 为 
浮 点 数 “。 


(D 要 理解 这 是 一 个 多 么 大 的 数 ， 可 以 想象 一 下 您 浴缸 里 的 水 分 子 数量 ， 它 比 这 个 还 
要 大 几 个 数量 级 。 

@) 学 过 C 语言 的 人 都 知道 ， 实 数 是 用 浮 点 型 ( float ) 来 处 理 的 。float 这 个 名 称 就 来 
源 于 浮 点 小 数 ( floating point number )。 
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以 前 关于 浮 点 数 有 各 种 不 同 的 约定 ， 现 在 都 标准 化 为 IEEE 754" 。 


目 IEEE 754 中 规定 的 浮 点 数 的 构成 

图 8.10 中 的 指数 相当 于 小 数 点 的 位 置 ， 尾 数 相 当 于 小 数 点 以 下 有 效 
数字 的 部 分 。 

左边 那 蒂 灯 (最 高 比特 位 ) ”代表 了 数 的 符号 。 该 位 为 0 时 表示 正 
数 ， 为 1 时 表示 负数 ”。 

接 下 来 的 8 发 灯 是 表示 位 数 的 指数 部 分 。 指 数 部 分 作为 整 效 理解 的 
话 可 以 表达 0~255 之 间 的 数 ， 减 去 127 得 到 范围 -127~128。 -127 和 
128 分 别 代 表 了 零 和 无 限 大 ， 剩 下 的 -126~127 代表 了 小 数 点 的 位 置 。 -126 
是 指 小 数 点 向 左 移动 126 位 ，127 是 指 小 数 点 向 右 移动 127 位 。 

其 余 的 23 伪 灯 是 尾数 部 分 ， 表 示 了 小 数 点 以 下 的 部 分 “。 尾 数 部 最 
左边 的 灯泡 表示 1/2 (二 进 制 中 的 0.1 )， 接 下 来 是 14〈 二 进 制 中 的 
0.01 )。 请 看 图 8.10 中 的 1.75 这 个 数 ， 它 等 于 1+1/2+1/4， 用 二 进 制 来 表 
示 就 是 1.11。 所 以 ，1/2 位 的 灯泡 和 14 位 的 灯泡 都 点 亮 。 指 数 部 分 为 
127〈 要 减 去 127 就 是 范围 中 的 0 )， 这 表示 小 数 点 的 位 置 移动 0 位 。 这 
两 点 组 合 起 来 就 是 1.75。 

接 下 来 的 数 3.5， 用 二 进 制 来 表示 是 11.1。 小 数 点 向 左 移 动 一 位 就 
得 到 1.11。 所 以 它 的 尾数 部 分 和 1.75 一 样 ，1/2 位 和 1/4 位 点 亮 。 指 数 
部 分 变 成 128 ( 减 去 127 就 是 范围 中 的 1 )。3.5( 二进制 中 的 11.1 ) 其 实 
就 是 1.75 (二进制 中 的 1.11 ) 的 小 数 点 向 右 移动 一 位 得 到 的 数 ”。 而 7.0 
则 是 由 指数 部 分 继续 加 1 得 到 。 


(D 官方 名 称 为 “IEEE Standard for Floating-Point Arithmetic (ANSIIEEE Std 754-2008)"。 

IEEE 754 最 早 制 定 于 1985 年 ， 后 于 2008 年 进行 了 修订 。 另 外 ， 在 此 标准 规定 有 

5 种 标准 类 型 ， 这 里 仅仅 说 明了 其 中 的 单 精度 二 进 制 浮 点 数 。 

也 可 以 称 之 为 MSB (most significant bit )， 最 高 有 效 位 。 

在 标准 中 ， 零 区 分 为 正 的 震 和 负 的 零 。 

准确 来 讲 ， 尾 数 是 在 二 进 制 表达 中 为 使 得 整数 部 分 变 成 1 而 移动 小 数 点 得 到 的 小 

数 部 分 。 

(3) 在 二 进 制 中 , 小数 点 移动 一 位 进位 不 是 10 倍 而 是 2 倍 。 指 数 部 分 加 1， 变 成 2 们 ， 
减 1 变 成 1/2。 


外 鸭 的 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


一 


106 | 第 8 章 类 型 


和 图 8.10 IEEE 754 中 单 精 度 二 进 制 浮 点 数 的 原理 图 


符号 指数 部 分 尾数 部 分 


1/2 1/4 


1.75 OOD@@e@eee888O000000000000000000000D 


由 问题 点 

现今 大 家 接触 到 的 语言 中 ， 实 数 大 多 用 浮 点 数 IEEE 754 表达 。 从 
实用 角度 来 看 ， 大 部 分 情况 下 这 没有 任何 问题 。 但 是 ， 这 种 方法 要 表达 
3 除 以 10 的 答案 时 ， 十进制 中 可 以 确切 表达 出 来 的 0.3 在 二 进 制 中 却 变 
成 了 0.0100110011001100110011…… 这 样 的 无 限 循 环 小 数 ， 无 论 怎 么 写 
都 有 误差 存在 。 正 因为 如 此 ， 会 出 现 对 0.3 做 十 次 加 法 并 售 去 某 些 位 数 
后 得 到 2 这 样 的 现象 。 

77 0 3 做 70 天 加 去 册 得 个 到 3 


S300 039 3 03 903 0 0 5350 0 31 0 2 5 0 
2.9999999999999996 


// 舍弃 后 变 成 了 2 
> Maemelooa(0Ne 0 0 OO OU OUR OUROEOR OORR) 
之 


银行 和 外 汇 交 易 等 涉及 资金 操作 的 场合 尤其 不 欢迎 这 种 系统 行为 ， 
所 以 这 些 场合 使 用 的 是 定点 数 或 者 加 三 码 ( excess-3 ) 这 样 的 十 进 制 计 
算 方式 ，。 


QD 一 般 也 叫做 二 一 十 进 制 码 ， 加 三 码 (excess-3 ) 就 是 其 中 一 种 。 
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6.5 
为 什么 会 出 现 类 型 
至 此 ， 我 们 学 习 了 如 何 用 开 和 关 的 组 合 ( 比特 列 ) 来 表示 整数 和 小 


数 。 在 一 般 人 看 来 ， 整 数 7 和 小 数 7.0 是 一 样 的 ， 但 在 计算 机 看 来 ， 整 
数 和 浮 点 数 是 完全 不 同 的 (图 8.11 )。 


1 图 8.11 浮 点 数 7.0 和 整数 7 的 比特 列 的 差异 
7.0 O@O000008@8@O000000000000000000090 


整数 7 


1073741824 8388608 4194304 2097152 i: 4 2 1 


对 于 计算 机 来 说 ， 如 采 仅 仅 给 定 一 串 比 特 列 ， 它 是 不 知道 这 应 该 解 
释 为 整数 还 是 浮 点 数 的 。 因 此 ， 需 要 有 表示 这 个 值 为 何 种 类 型 的 额外 的 
信息 。 这 驶 是 类 型 。 我 们 来 一 起 看 一 下 没有 类 型 会 带 来 哪些 麻烦 。 


| 没有 类 型 带 来 的 麻烦 


浮 点 数 运 算 中 3.0+7.0 的 结果 是 10.0。 这 里 用 到 了 浮 点 数 相 加 运算 
的 命令 。 然 而 ， 如 果 忘 记 了 3.0 和 7.0 是 浮 点 数 而 将 它们 作为 整数 做 相 
加 运算 的 话 ， 结 果 会 怎样 呢 ? 3.0 和 7.0 的 比特 列 作 为 整数 读 取 时 将 变 
成 非常 大 的 数值 ， 因 为 左边 第 二 个 比特 位 在 解释 为 整数 时 ， 已 经 是 
1 073 741 824 这 么 大 了 “。 相 加 运算 的 结果 就 更 大 了 (图 8.12 A )“。 


(DD 1073741824 是 由 2 自 乘 30 次 得 到 的 。 

@) 3.0 是 由 1073 741 824 + 4194304 得 到 1 077 936 128，7.0 是 由 1 073 741 824 + 
8 388 608 + 4 194 304+2 097 152 得 到 1 088 421 888 ， 相 加 的 结果 是 2 166 358 016。 
考虑 上 符号 的 话 就 变 得 更 复杂 了 ， 这 里 只 解释 不 带 符号 的 整数 情况 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


108 | 第 8 章 类 型 


有 1 图 8.12 7.0 和 3.0 作为 整数 做 加 法 和 作为 浮 点 数 做 加 法 的 结果 差异 


7.0 OBOO0000088@O00000000000000000009D 
3.0 OBOO000008O000000000000000000009 
(A) ©@OO00008008O000000000000000000009D 
10.0 OBOO0008OC08O00000000000000000009D 


重新 把 这 个 相 加 的 结果 作为 浮 点 数 来 读 的 话 ， 小 数 点 以 下 是 37 个 
0， 变 成 十 分 接近 0 的 一 个 负数 "。 这 与 期 待 的 结果 大 相 径 庭 。 看 来 ， 要 
不 出 现 这 样 的 错误 必须 多 加 注意 。 


| 早期 的 FORTRAN 语言 中 的 类 型 


在 内 存 中 记录 的 数值 是 整数 还 是 浮 点 数 ， 单 靠 人 的 记忆 很 难 避 免 错 
误 。 有 没有 更 为 简易 的 方法 呢 ? 

一 种 方法 是 用 确定 的 规则 来 表示 变量 名 所 表达 的 内 容 。 比 如 ， 早 期 
的 FORTRAN 语言 使 用 了 一 系列 规则 ， 指 定 以 I~N 开头 的 变量 名 表示 整 
数 ， 除 此 以 外 的 表示 浮 点 数 。 


告诉 处 理 器 变量 的 类 型 


男 一 种 更 好 的 方法 是 告诉 处 理 带 菜 果 变量 是 整数 ， 让 计算 机 而 不 是 
大 埃 记 忆 广 一 入 局 a 

这 就 是 变量 的 类 型 的 声明 产生 的 原因 。 比 如 C 语言 中 ， 声 明 int x; 
表示 名 字 为 x 的 变量 指向 的 内 存 被 解释 为 整数 ， 声 明 float y; 表示 名 字 
为 y 的 变量 指 癌 的 内 存 补 解释 为 浮 点 数 。 这 样 通过 提供 关于 类 型 的 信 
上 县， 处 理 带 在 进行 运算 时 ， 就 能 目 动 判断 该 做 整数 相 加 运算 还 是 译 点 数 
相 加 运算 ， 而 不 需要 人 们 逐个 去 指定 。 


Q) 正确 地 说 是 一 2.93874e-38。 
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i 隐 性 类 型 转换 


代码 中 x+y 这 样 的 语句 ， 处 理 带 是 怎么 执行 的 呢 ?” 人 们 可 能 会 很 直接 
地 想到 简单 做 个 加 法 了 事 ， 但 是 对 于 计算 机 来 说 ， 整 数 的 加 法 运算 和 浮 
点 数 的 加 法 运算 是 完全 不 同 的 两 件 事情 ， 不 妥当 地 予 与 区 分 是 不 行 的 。 
目 整数 之 间 、 浮 点 数 之 间 的 运算 

计算 机 参照 数据 的 类 型 来 决定 怎样 执行 。 如 果 x 和 y 同 为 整数 ， 就 
做 整数 之 间 的 加 法 运算 。 如 采 x 和 yy 同 为 浮 点 数 ， 就 做 浮 点 数 之 间 的 加 
法 运算 。 


C 语 言 中 整数 x 和 整数 相 加 


int x = 1, ret.; 


ret = XxX + 1024; /* 二 这 个 加 法 运算 */ 


return ret.; 


在 汇编 语言 中 变 成 
movil -12(%rbp), %Seax 

addl $1024, %eax # < 整数 的 加 法 运算 命令 
movil Seax, -16(%rbp) 


目 一 边 为 整数 一 边 为 浮 点 数 的 运算 

那 如 果 一 边 是 整数 男 一 边 是 浮 点 数 ， 该 如 何 处 理 呢 “? 

在 早期 的 FORTRAN 语言 中 这 将 导致 错误 发 生 ， 因 此 需要 程序 显示 
地 使 用 转换 函数 来 指示 类 型 转换 。 而 在 C 语言 中 是 自动 地 隐 性 地 将 整数 
转换 为 浮 点 数 再 进行 运算 。 比 如 x + 1024 中 ， 如 果 x 是 浮 点 数 ， 程 序 会 
将 1024 先 转换 为 浮 点 数 再 进行 加 法 运算 。 


C 语 言 中 浮 点 数 x 和 整数 相 加 


EGGE RE lL,.0, FAECES 
ret = x + 1024; /* < 这 个 加 法 运算 */ 


return ret: 


在 汇编 语言 中 变 成 


由 因 语 言 不 同 ， 有 时 需要 考虑 到 更 多 情形 ， 比 如 是 字符 串 怎 么 办 ， 是 时 间 怎 么 办 ， 


等 等 。 
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moOVSS (ly nlo 

movabsq SO 

cvtsi2ssq Srax, Sxmml # < 整数 到 浮 点 数 的 转换 命令 
addss Sxmml1, SxmmO # < 浮 点 数 的 加 法 运算 命令 
mov8ss $xmm0, -16(%rbp) 


这 样 一 来 就 方便 很 多 了 。 这 是 因为 ， 不 管 是 整数 加 法 运算 还 是 浮 点 
数 加 法 运算 ， 结 采 都 不 会 产生 太 大 的 差异 。 


由 问题 点 
我 们 考虑 一 下 x /2 这 样 的 代码 是 什么 意思 。 如 条 x 为 整数 ， 除 法 运算 
后 ， 小 数 点 以 下 部 分 会 被 舍 去 。 也 就 是 说 ,在 x 为 1 时 ， 计 算 结 末 就 是 0. 
如 有 果 x 为 浮 点 数 ， 除 法 运算 后 变 成 小 数 点 位 数 足 够 文 持 显示 的 数 。 
也 就 是 说 ， 在 x 为 1 时， 计算 结果 就 是 0.5. 
程序 员 如 果 事 先 不 知道 x 的 类 型 ， 见 到 x /2 这 样 的 代码 也 不 能 判断 
是 否 会 发 生 小 数 部 分 舍 去 。 而 让 人 们 非 记 住 类 型 不 可 ， 这 和 类 型 产生 的 


本 意 是 想 违背 的 ”。 


C 语 言 
/* 仅 做 除法 的 函数 */ 
下 下 用 


return x / 2; 


sn 


/* 比 孙 数 和 divide int 相 类 似 ， 愉 是 XxX 的 类 型 不 同 */ 
float divide float(float x){ 


return x / 2; 


Wem 


BelinmeE ("SE\n, divide int (1)); 20 000000%/ 
BrlmeE(SE\n, divice EloaE(l)); /= => 输出 0.500000 */ 
} 
(D 从 实用 角度 来 看 ， 写 成 x /2.0 的 形式 在 X 为 整数 时 也 将 其 转换 为 浮 点 数 ， 这 也 是 


一 种 回避 策略 ， 但 不 习惯 的 话 还 是 比较 容易 gy 
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目 用 与 法 来 区 别 的 语言 

C 语言 中 采用 的 设计 方法 是 由 计算 对 象 的 类 型 来 决定 是 否 舍 去 小 数 
部 分 。 这 一 方法 在 很 长 时 间 内 被 很 多 语言 使 用 ， 以 至 于 很 多 程序 员 都 非 
党 习惯 ， 认 为 理所当然 。 然 而 ， 这 个 不 是 恒久 不 变 的 物理 法 则 ， 只 不 过 
是 人 们 确立 的 设计 方法 而 已 。 因 此 并 不 是 所 有 的 语言 都 采用 这 种 设计 。 
比如 在 1973 年 问世 的 ML 语言 中 ， 整 数 的 除法 运算 就 表达 为 x div y， 
而 浮 点 数 的 除法 运算 表达 为 x/y 。 另 外 1991 年 问世 的 Python 语言 起 初 
使 用 的 是 混杂 着 C 语言 风格 的 除法 运算 方式 。 大 家 从 2001 年 开始 讨论 
这 种 设计 的 恰当 性 ， 于 2008 年 发 布 的 Python 3.0 中 做 了 变更 , 把 x/y 
作为 与 x 和 y 类 型 无 关 不 做 舍 去 的 除法 运算 ， 带 舍 去 的 除法 运算 用 x //y 
来 表示 “。 
下 克 于 


> TL / 2 
0 
SE 1 // 2 
0 


Python 3.0 


> TL / 2 
OS 

SS TL // 2 
0 


8.6 
类 型 的 各 种 展开 


最 初 为 加 入 数值 的 类 型 信息 而 开始 使 用 的 类 型 的 概念 ， 随 后 被 应 用 
到 越 来 越 多 的 场合 。 这 或 许 也 是 类 型 的 概念 变 得 难 懂 的 原因 之 一 吧 。 接 


Q) ML 语言 使 用 了 “类 型 推断 ”理论 ， 即 程序 员 不 做 类 型 声明 时 ， 仅 根据 变量 使 用 
方式 来 推论 其 类 型 ， 它 是 一 门 专注 于 类 型 的 语言 。 其 后 继 语言 OCaml 中 也 用 X/y 
和 X/y 来 区 分 整数 的 除法 运算 和 浮 点 数 的 除法 运算 。 


© PEP238-- Changing the Division Operator, http://www.python.org/dev/peps/pep-0238/. 
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下 来 ， 我 们 来 看 一 下 类 型 的 不 同 应 用 方式 。 


| 用 户 定义 型 和 面向 对 象 


首先 ， 使 用 语言 中 自 带 的 基本 数据 类 型 通过 组 合 定义 新 的 类 型 的 这 
一 功能 被 发 明 出 来 ， 如 C 语言 中 的 结构 体 。 这 被 称 为 用 户 定义 型 ”。 
GE 


/* 整数 型 和 字符 串 类 型 组 合 得 到 新 的 person 类 型 */ 


struct personm /| 


int age; 


char *name; 


其 实 ， 不 仪 限 于 整数 这 样 的 数据 ， 函 数 这 样 决定 数据 如 何 被 处 理 的 
对 象 也 被 粹 合 到 类 型 中 来 了 。C++ 语言 的 设计 者 本 贡 尼 … 斯 特 劳 斯 特 户 
普 把 用 户 能 目 定 义 的 类 型 当 作 构造 程序 的 基本 要 素 ， 把 这 种 类 型 冠 名 为 
类 。 这 就 是 第 二 次 面向 对 象 的 发 明 ”。 


| 作为 功能 的 类 型 


上 区 别 公 

后 来 
的 类 型 
编译 器 来 


JT 
-LLL 
TIT 
S 
9H 


站 


二 


既是 功能 的 观念 。 这 种 观念 认为 ， 构 成 结构 体 和 类 
公开 而 是 最 小 限度 地 公开 ， 类 型 是 否 一 致 这 个 交 由 
， 用 类 型 来 表达 功能 ， 与 功能 是 否 一 致 也 是 由 编译 天 来 检 
查 。 因 此 ， 只 需要 将 与 外 部 有 交互 的 部 分 作为 类 型 公开 ， 而 实现 的 细节 
则 隐藏 起 来 ”。 这 样 类 型 就 被 区 分 为 公开 部 分 和 非 公开 部 分 了 。 学 过 C++ 
语言 或 Java 语言 的 人 应 该 知道 public 和 private 这 样 的 访问 控制 标志 。 


站 
和 一 


AT 


H> 尊 
DK 峙 


3 
六 和 评 主 汗 
BN 


伺 


AN 


~ 


癌 噶 


@ ~、 
型 


(D 在 C 语 言 之 前 的 COBOL 语言 中 ， 可 以 用 基本 的 类 型 组 合 起 来 定义 一 种 带 有 层次 
结构 的 记录 类 型 。 另 外 ，PL/ 语言 也 有 能 组 合 基本 类 型 并 创建 新 的 类 型 的 语句 
DEFINE STRUCTURE。 结构 体 ( structure ) 这 个 术语 应 该 就 是 从 那 时 候 开 始 使 用 的 。 

@ 关于 第 一 次 面向 对 象 为 何 物 ， 请 参考 第 11 章 。 

(3) 对 外 部 公开 的 部 分 和 非 公 开 部 分 要 区 分 开 来 ， 基 于 这 一 观点 的 访问 控制 被 使 用 于 
诸如 Modula-2 ( 1978 年 ) 的 模块 中 和 CLU (1974 年 ) 的 抽象 数据 类 型 中 。 
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目 发 展 为 接口 

将 类 型 即 功能 的 观念 进一步 延伸 ， 就 产生 了 不 包含 有 有 具体 的 实现 细 
方 的 类 型 ( Java 语言 中 的 接口 等 )。 男 外 把 孔 数 是 否 抛 出 异常 这 一 信息 
也 当 作 类 型 的 语言 出 现 了 ”。 

下 面 是 Java 语言 中 Runnable 接口 除去 备注 后 的 代码 。 这 个 接口 定义 
了 一 个 不 带 参 数 、 不 返回 值 ( void )、 带 有 一 个 名 为 run 的 方法 的 功能 。 


java .lang .Runnable 接 口 


package java.lang; 
public interface Runnable { 


ouolie ograde ol Tum()s 


} 


我 们 来 看 这 一 功能 在 何 处 被 使 用 到 ， 比 如 ，java.lang.Thread 中 有 一 
个 构造 吨 数 Thread (Runnable target)。 它 的 功能 就 是 ， 只 要 是 满足 不 溃 参 
数 、 不 返回 值 、 带 有 一 个 名 为 run 的 方法 的 类 ,不 管 具 体 的 实现 细 市 ， 
都 可 以 被 传递 给 Thread 的 构造 咀 数 。 


由 用 类 型 实现 所 有 功能 的 时 代 到 来 了 吗 

类 型 即 是 功能 的 方法 得 到 了 越 来 越 广泛 地 应 用 ， 但 遗憾 的 是 ， 用 类 
型 来 实现 所 有 功能 的 想法 却 还 没有 成 功 。 如 果 它 能 成 功 ， 就 很 理想 了 : 
只 要 类 型 一 致 就 不 用 关心 内 部 的 实现 细节 ， 功 能 与 类 型 的 不 一 致 灾 由 编 
译 右 来 检查 ， 编 译 通过 意味 着 没有 bug。 然 而 ， 仍 有 不 少 类 型 无 法 表达 
的 信息 ， 如 输入 这 个 数据 需要 多 少 处 理 时 间 ， 这 个 处 理 过 程 需 要 多 少 内 
存 ， 线 程 中 是 否 可 以 进行 这 种 操作 等 。 至 今 ， 这 些 问 题 也 只 能 通过 人 为 
地 读 取 文 档 和 源 代 码 来 判断 。 


| 总 称 型 、 泛 型 和 模板 


通过 将 不 同类 型 进行 组 合 得 到 复杂 的 类 型 后 ,使 用 中 会 出 现 想 更 改 
其 中 一 部 分 却 又 不 想 全 部 重新 定义 的 再 利用 需求 。 
因此 出 现 了 构成 要 又 部 分 可 变 的 类 型 ， 即 总 称 型 。 想 要 表现 不 同 的 


(Dy CLU 语言 和 Java 语言 都 会 进行 异常 检查 ， 详 细 介 绍 请 参考 第 6 章 。 
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情况 时 ， 出 现 了 以 类 型 为 参数 创建 类 型 的 函数 。C++ 语言 中 的 模板 、 
Java 语言 中 的 泛 型 以 及 Haskell 语言 中 的 类 型 构造 带 可 以 说 就 是 这 种 创 
建 类 型 的 机 制 ”。 
目 C++ 语言 中 

我 们 首先 来 看 C++ 语言 中 的 模板 。 在 用 户 定 义 型 和 面向 对 和 象 一 方 中 
定义 的 person 结构 体 中 追加 something 这 一 字段 ， 如 下 所 示 。 


CC 机 


#include <ijostream> 


template<typename 工 > 
Struiet erson | 

int age; 

char *name; 


T something,; QO 


I 


me ma 
ES 和 
X.Something = 1; 


esonseens en 7 


OOOO 


y.something = "hoge"; 


std::cout << x.sSomething << std::endl; // -> 1 


std::cout << y.something << std::endl; // -> hoge 


这 里 的 something 的 类 型 目前 还 没有 确定 。 通 过 包括 在 
template<typename T>… ; 范围 内 ， 它 其 实 是 声明 了 了 T 是 一 个 类 型 参数 后 
面 要 代入 具体 的 类 型 ， 而 QO 的 写法 声明 了 something 的 类 型 就 是 后 面 才 
确定 的 T 的 类型。 

随后 ， 在 main 国 数 中 ，person<int> (@ ) 将 int 类 型 代入 person 的 
类 型 参数 TT 中 ,创建 了 一 个 新 的 类 型 。 这 个 类 型 中 something 是 整数 型 ， 
于 是 就 可 以 如 合 句 给 它 赋值 整数 数值 了 。 


QQ) 在 C++ 语言 中 也 有 以 类 型 为 参数 返回 函数 的 函数 模板 ， 这 里 只 做 简单 介绍 。 
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另外 ， 在 TT 中 代入 const char* 创建 新 的 类 型 后 (@ )， 束 可 以 如 @ 
句 给 它 赋值 字符 串 ( const char* ) 的 值 了 。 


和 Java 语言 中 
同样 地 ， 在 Java 语言 中 也 可 以 实现 ， 如 下 所 示 。 


public class GenericsTest { 

BUBli Scale vo ma( SE ram oar 
Person<Integer> x = new Person<Integer>(); 0O 
x.something = 1; 

Person<String> y = new Person<String>(); 
vseomeehhee uae 

System.out .printiln(x.something); // -> 1 
System.out .printiln(y.something); // -> hoge 


class Person<T>{ 
public Integer age; 
Dol1G seme mmne, 


Suomen sonmelle 


Java 语言 中 通过 class Person<T>， 声 明了 这 个 类 中 的 T 是 类 型 参 
数 。 随 后 与 C++ 语言 中 一 样 ， 通 过 人 @ 句 的 Person<Integer> 在 类 型 参数 
中 代入 Integer 类 型 进而 创建 了 新 的 类 型 。 
和 Haskell 语言 
在 Haskell 语言 中 可 以 这 样 实现 。 
data Person a = MakePerson {age :: Int, name :: String, something :: al} @ 
xX Person Int@ 
= MakePerson {age = 31, name = "nishio", something = 1} 
y :: Person String 
y = MakePerson {age = 31, name = "nishio'", something = "hoge".} 
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IE EGG 
print $ something x = > 
print $ something y ”hoagey 


通过 人 @ 中 的 data Person a = ... 声明 了 a 为 类 型 参数 。 随 后 在 全 中 将 
Int 代入 类 型 参数 中 创建 新 的 类 型 ， 声明 x 即 为 这 一 类 型 。 

这 个 例子 中 ,使 用 了 类 型 参数 的 地 方 只 有 一 个 ,或许 它 的 优势 体现 
得 不 太 明 显 。 人 然而 ， 在 something x 中 使 用 的 函数 something 从 Person 
Int 中 返回 Int 类 型 的 值 ， 在 something y 中 使 用 的 函数 something 却 从 
Person String 中 返回 String 类 型 的 值 ”。 如 果 要 在 没有 总 称 型 功能 的 语言 
中 实现 ， 就 需要 针对 每 个 现在 作为 参数 的 类 型 进行 改写 ， 然 后 逐个 实 
现 ， 陷 人 更 加 庞大 的 工作 量 之 中 。 

比如 Java 语言 中 list 类 型 java.util.ArrayList<E> 的 实现 中 ， 在 追加 
元 素 的 方法 boolean add (E e) 和 读 取 元 素 的 方法 E get (int index) 等 多 达 
52 处 使 用 了 类 型 参数 E， 如 果 一 处 一 处 改写 那 是 相当 麻烦 的 “。 


| 动态 类 型 


到 目前 为 止 ， 我 们 介绍 的 类 型 的 机 制 中 ， 处 理 需 把 变量 名 、 保 存 数 
值 的 内 存 地 址 、 内 存 里 的 内 容 的 类 型 三 者 作为 一 个 整体 来 看 待 。 把 类 型 
的 信息 和 数值 看 作 整 体 的 方式 叫 动态 类 型 。 作 为 其 反义词 ， 到 目前 为 止 
介绍 的 类 型 机 制 都 叫 静 态 类 型 。 

动态 类 型 在 LISP 语言 中 已 经 得 到 应 用 ， 之 后 在 Smalltalk 语言 中 得 
以 推广 ， 随 后 因为 计算 机 的 高 速 化 发 展 ， 其 应 用 领域 大 为 拓展 。 现 在 大 
多 数 的 脚本 语言 都 采用 了 动态 类 型 。 

比如 使 用 了 动态 类 型 的 脚本 语言 之 一 的 Python 语言 中 ， 变 量 声明 时 
不 需要 声明 类 型 ， 对 同一 个 变量 既 可 以 赋值 整数 也 可 以 赋值 浮 点 数 。 


J 顺带 一 提 ， 像 这 种 同一 个 函数 名 下 面具 有 多 种 函数 实现 方式 的 情况 称 为 重 载 (多 
重 定义 ，overload )。 上 一 小 节 中 讲 到 的 加 法 运算 符 “+” 既 被 用 于 两 个 整数 的 相 
加 运算 也 被 用 于 浮 点 数 的 相 加 运算 ， 这 也 是 重 载 的 一 种 。 

( 这 里 的 巨 是 元 素 (element ) 的 首 字母 ， 它 仅仅 是 类 型 参数 的 名 称 ， 和 用 工 表 示 没 
有 本 质 的 区 别 。 
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治 三 多 马 和 4 
和 如 何 实现 

这 是 如 何 实现 的 呢 ? 动态 类 型 语言 中 之 所 以 不 需要 声明 类 型 ， 是 因 
为 在 内 存 上 使 用 了 同等 类 型 对 待 的 设计 方法 ”。 比 如 Python 语言 中 ,不 
管 是 整数 还 是 浮 点 数 还 是 字符 串 ， 全 部 都 作为 PyObject 对 待 ， 开 始 部 分 
都 是 一 样 的 (图 8.13 )。 另 外 在 PyObject 类 型 的 结构 中 还 预 留 了 保存 值 
的 类 型 信息 的 地 方 。 
和 图 8.13 ”Python 语言 中 值 的 开始 部 分 结构 都 是 一 样 的 
Python 的 值 (PyObject 型 ) 


Python 的 整数 ( PylntObiject 型 ) 


使 用 次 数 ”| 值 的 类 型 
整数 | 整数 型 


Python 的 实数 ( PyFloatObject 型 ) 


使 用 次 数 值 的 类 型 
| 浮 点 数 ] 


Python 的 字符 串 ( PyStringObject 型 ) 
使 用 次 数 值 的 类 型 散 列 值 状态 9 
| 字符 串 | 


※ 使 用 次 数 是 指 在 内 存 管理 中 记录 这 个 数值 有 几 处 被 参照 引用 的 数值 ( 引用 计数 )。 
※ 字符 串 的 散 列 值 是 散 列 函数 的 计算 结果 ( 详 见 第 9 章 )， 状 态 是 表示 该 字符 串 是 否 记录 在 Internpool 
里 《处 理 器 是 否 把 该 字符 串 进行 唯一 处 理 的 标志 )。 


Python 语言 中 的 x 变量 在 C 语言 中 会 表达 为 PyObject* x。 因 此 ， 
要 谈 取 数值 时 ， 首 先 将 内 存 上 的 比特 列 作 为 PyObject 谈 取 ， 便 可 知 该 数 
是 整数 、 浮 点 数 还 是 字符 串 了 。 青 据 此 决定 实际 的 数值 以 何 种 方式 从 内 


(DD 这 一 点 在 其 它 的 脚本 语言 中 也 是 同样 的 情况 ， 比 如 在 Ruby 语言 中 ,任何 数值 都 
是 VALUE 类 型 的 。 
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存 中 该 取出 来 。 如 果 是 整数 ， 表 示 在 第 三 个 单位 里 存放 着 整数 。 如 果 是 
浮 点 数 ， 表 示 第 三 个 单位 里 存放 着 浮 点 数 。 如 果 是 字符 串 ， 第 三 个 单位 
存放 的 是 整数 型 的 表示 字符 串 长 度 的 数 ， 实 际 的 字符 串 从 第 六 单元 开始 
该 取 。 


外 优势 与 不 足 

使 用 这 种 数值 类 型 处 理 方法 ,外 局 
灵活 人 处理 。 运 行 时 确定 类 型 和 改变 类 型 成 为 可 能 。 然 而 ， 它 也 有 一 
足 。 毅 态 类 型 语言 在 编 详 时 确定 类 型 ， 同 时 编 详 时 也 检查 了 类 型 的 一 致 
性 。 有 了 这 种 类 型 检查 ， 在 实际 执行 前 ， 便 能 发 现 一 部 分 bug。 这 一 点 
动态 关 型 语言 是 无 法 做 到 的 。 


| 类型 推断 


既 不 放弃 编译 时 的 类 型 检查 ， 也 想 尽 量 减 少 麻烦 的 类 型 声明 ， 要 实 
现 这 一 要 求 就 要 用 到 计算 机 自动 推论 确定 类 型 的 方法 。 

类 型 推断 最 早 是 OCaml 语言 和 Haskell 语言 这 样 的 ML 语言 擅长 的 
领域 ， 最 近 ， 在 Java VM 上 运行 的 Scala 语言 等 采用 了 类 型 推断 的 语言 
变 得 越 来 越 多 。 

有 Haskell 语言 和 没有 类 型 推断 的 C 语 言 的 比较 
在 Haskell 语言 中 定义 加 1 的 函数 add_one 如 下 所 示 。 
GHCi 2 


Ss let add one = \X -> XH 1 

查询 add_one 的 类 型 ,得 到 的 结 来 是 取 一 整数 返回 为 一 整数 的 水 
数 。 基 于 1 是 一 个 整数 而 加 法 运算 符 + 是 取 两 个 了 类 型 的 值 返回 T 类 型 
值 的 函数 这 两 点 ,语言 处 理 器 得 出 参数 和 返回 值 都 为 整数 的 结论 “。 


QD 严格 来 讲 ， 在 Haskell 语言 中 1 并 不 是 整数 型 而 是 包含 了 Float 等 类 型 的 型 类 
Num。 这 里 的 推论 受 “ 默 认 声 明 ” 的 影响 ,篇幅 所 限 ， 在 此 不 多 次 述 。“6.3 
Standard Haskell Classes” http:/www.haskell.org/onlinereport/basic.html “4.3.4 
Ambiguous Types, and Defaults for Overloaded Numeric Operations” http://www. 


haskell.org/onlinereport/decls.html#default-decls 
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lone 


Sionmencee see ee 


来 看 看 在 C 语言 中 如 何 定 义 加 1 的 函数 。 这 时 候 需 要 人 为 地 声明 参 
数 和 返回 值 的 类 型 为 int。 
mt dd omel( me el 


eturn xX i: 


} 
有 Haskell 语言 的 类 型 推断 
同样 是 使 用 类 型 推 岂 这 一 术语 ， 在 不 同 的 语言 中 ， 如 何 做 类 型 推断 
以 及 类 型 推断 的 能 力 如 何 ， 人 情况 是 不 一 样 的 。 我 们 来 比较 一 下 Haskell 
语言 和 Secala 语言 。 
首先 创建 一 个 “取出 x 返回 x”， 此 外 什么 也 不 做 的 函数 identify， 
再 查询 一 下 它 的 类 型 。 


> let 16mEley ss \R = KR 


> :type identity 
elemEney es 
没有 做 任何 类 型 声明 的 情况 下 创建 了 函数 identify， 碍 询 其 类 型 的 

结果 是 ->t， 这 表示 获取 某 种 类 型 的 参数 返回 相同 类 型 参数 的 函数 。 这 
和 预期 是 一 致 的 。 那 么 我 们 把 identify 作为 参数 来 调用 函数 identify 试 试 
看 。 因 为 identify 是 返回 和 参数 同样 的 类 型 的 函数 ， 把 identify 作为 参数 
调用 孙 数 的 话 ， 返 回 也 是 identify， 亦 即 identify 的 类 型 该 是 t->t。 男 外 
identify identify 1 因为 是 identify 1 所 以 最 终 是 1。 我 们 来 确认 一 下 。 

> :type identity identity 

identity identity :: 七 -> 攻 


> identity identity 1 
1 
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和 Scala 语言 的 类 型 推断 

Scala 语言 中 类 型 推断 的 行为 和 Haskell 语言 是 不 一 样 的 。 它 会 首先 
来 定义 identify 函数 。 如 果 像 Haskell 语言 中 那样 不 指明 任何 类 型 ， 将 导 
致 错误 (@ )， 有 必要 人 为 指定 参数 的 类 型 导 和 人类 型 参数 ( @ )。 定义 好 
的 identify 的 类 型 是 把 T 作为 类 型 参数 接受 T 并 返回 T 的 孔 数 (全 )。 虽 
然 没 有 人 为 地 写 明 返回 值 的 类 型 ， 但 它 从 参数 的 类 型 中 被 推论 出 来 了 。 


Scala 的 对 话 终 站 


sealaS def deneity 7 1) 
<console>:7: error: missing parameter type 


def identity = x => XxX 


人 


scala> def identity[T] = (x :IT) =>x © 
ndeneity TI > T= 人 T 3 

接着 来 确认 identify (identify) 的 类 型 。Scala 语言 没 能 很 好 地 推论 出 
类 型 ， 显 示 成 接受 nothing 返回 nothing 的 函数 (@ )。Scala 语言 中 的 
Nothing 类 型 是 指 属 于 该 类 型 的 值 不 存在 的 一 种 特殊 的 类 型 。 这 意味 着 
问 该 类 型 赋值 任何 参数 都 将 导致 类 型 错误 。 试 着 把 整数 的 1 赋值 给 它 
看 看 ， 的 确 出 现 了 错误 ， 指 出 “需要 Nothing 型 的 数值 却 被 赋值 Int 型 
的 1”(@ )。 


Scala 的 对 话 终端 

seal denene em (4) 
esOENoemnee No Sven 
sel ene en © 


<Console>:9: error: type mismatch,; 
Winmdg :ea (le 
required: Nothing 


identity(identity) (1) 


人 


由 此 可 见 ， 同 样 是 使 用 类 型 推 汤 的 表达 方法 ,不同 语 言 指示 的 具体 
内 容 是 不 一 样 的 。 刚 刚 展 示 了 Scala 语言 推论 失败 的 一 个 例子 ， 即 使 推 
论 成 功 了 ,在 实用 价值 上 有 没有 优势 这 个 问题 上 ， 大 家 也 是 有 意见 分 上 收 
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的 。 即 使 承认 它 的 优势 而 对 类 型 推断 的 机 制 进行 修改 ， 在 由 此 币 来 的 作 
业 代 价 与 推论 失败 的 代价 之 间 做 权衡 之 后 ， 再 决定 否 应 该 做 改进 和 变更 
将 是 一 个 更 加 困难 的 问题 。 


和 强 类 型 下 是 否 可 以 做 到 程序 没有 bug 

类 型 推断 与 理论 推论 之 间 有 对 应 关系 ”。 于 是 有 些 语 言 发 出 挑战 , 试 
图 通过 使 用 比 C 语 言 和 Java 语言 更 强力 的 类 型 系统 来 证 明 程 序 中 没有 
任何 bug。 今后 在 改善 类 型 系统 的 表现 力 和 类 型 推断 规则 方面 应 该 会 开 
展 各 种 研究 。 

然而 ， 我 们 也 时 第 听 到 一 些 关 于 类 型 的 言论 ， 有 观点 认为 编译 通过 
说 明 没有 bug 或 者 说 可 以 设计 出 没有 bug 的 程序 。 这 些 观点 在 多 大 程度 
上 是 现实 的 呢 ?” 这 里 笔者 想 引 用 日 本 计算 机 先驱 人 物 后 匡 喘 一 的 文章 。 


当今 ， 关 于 SP” 和 程序 正确 性 的 检测 法 方面 的 研究 ， 从 一 开始 
就 以 没有 bug 的 程序 设计 为 目标 。 这 个 要 是 能 百 分 百 成 功 的 话 ， 到 
后天" bug 就 应 该 全 部 灭绝 了 吧 。 如 果 这 个 目标 不 能 达成 ， 大 家 还 
将 继续 依靠 直觉 和 经 验 ， 使 用 和 今天 差不多 的 调试 技术 吧 。 也 就 是 
说 ， 当 今 ， 比 起 研究 如 何 避 免 bug 产生 ， 大 家 投入 在 研究 如 何 及 早 

发 现 bug 并 将 其 杀 死 方面 的 热情 并 不 高 。 
后 茧 英 一 “计算 机 科学 的 今天 、 明 天 和 后 天 ”中 的 程序 设计 语言 一 节 ” 


※ 作者 注 : SP 即 现在 所 谓 的 结构 化 程序 设计 的 略称 。 


他 写 这 篇 文章 的 时 候 是 1976 年 ， 是 撰写 本 书 的 36 年 前 。 已 经 过 去 
36 年 了 ，bug 并 没有 全 部 灭绝 ， 接 下 来 到 底 还 要 花 几 十 年 的 时 间 才 能 做 
到 呢 “。 


由 比如 ， 在 一 个 接受 和 型 参数 返回 YY 型 返回 值 的 函数 中 传递 一 个 X 型 的 数值 ， 会 
得 到 立 型 的 返回 值 。 这 一 关于 类 型 的 描述 与 “X 为 真 在 如 果 X 则 站 的 情况 下 ，Y 
就 为 真 ” 这 一 逻辑 的 描述 是 相对 应 的 ， 被 称 为 Curry-Howard 对 应 。 

SP 就 是 现在 所 讲 的 结构 化 编程 ( structured programming ) 的 简称 。 

Bit，Vol.10, 1976 年 , pp.87。 

为 了 尽早 发 现 bug， 通 过 频繁 地 进行 测试 达到 及 时 发 现 bug 的 “测试 驱动 型 开发 ” 
和 “持续 集成 ”等 方法 越 来 越 首 及 ， 这 一 现象 值得 注意 。 


外 鸭 的 
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本 章 我 们 在 学 习 类 型 为 何 物 以 及 类 型 为 什么 有 必要 之 前 先 学 习 了 数 
是 如 何 表现 的 。 

用 10 个 印记 来 表现 数 10 这 是 最 原始 的 计数 方法 。 人 类 一 直 在 探索 
如 何 用 最 简洁 的 方式 来 表达 数字 ， 于 是 发 明了 进位 法 。 并 且 在 追求 效率 
的 过 程 中 发 明了 非 逢 十 而 是 逢 二 进位 的 二 进 制 方法 。 二 进 制 法 在 计算 机 
的 数字 表现 上 发 挥 着 非常 重要 的 作用 。 

另外， 为 了 表现 带 有 小 数 点 的 数 发 明了 定点 数 和 浮 点 数 。 现 今 ， 虽 
然 浮 点 数 得 到 了 广泛 的 应 用 ， 但 我 们 也 看 到 了 它 的 一 些 不 足 之 处 。 

计算 机 中 的 数值 是 整数 、 浮 点 数 还 是 其 他 类 型 的 数 ， 为 了 在 计算 机 
中 管理 这 一 信息 ， 于 是 众生 了 类 型 。 起 初 ， 类 型 中 只 加 入 了 数值 的 种 类 
信息 ， 最 后 又 有 多 种 多 样 的 信息 加 入 进来 。 比 如 ， 能 在 这 个 数值 上 施加 
的 操作 、 此 顶 数 可 能 抛 出 的 异 背 等 信息 都 被 加 入 到 类 型 中 来 了 。 

现在 ， 像 静态 类 型 和 动态 类 型 那样 连 内 存 地 址 和 使 用 时 间 都 不 一 样 
的 事物 也 被 称 为 类 型 ， 这 使 得 类 型 这 种 东西 变 得 越 来 越 难以 捉摸 。 什 么 
样 的 信息 放 在 什么 地 方 ， 在 什么 样 的 时 间 被 使 用 ， 从 这 个 视角 来 看 反而 
更 容易 理解 。 


i 


先 掌 握 概 要 天 阅读 细 届 


关于 面 对 庞 大 信息 量 心力 交 竣 时 该 怎么 办 的 问题 ， 我 们 在 第 6 章 6.6 节 
节 末 “学 习 讲求 细 嚼 慢 咽 ”专栏 中 介绍 了 三 种 方法 。 第 二 种 方法 就 是 “ 先 掌 
握 概 要 绸 阅读 细节 "。 

书 和 文档 都 会 有 目录 。 浏 览 一 遍 目录 便 可 以 了 解 大 概 构造 了 。 然 后 便 可 
以 开始 正文 的 跳跃 式 阅 读 了 。 不 要 了 逐 字 逐 句 地 读 ， 首 先 看 副标题 和 粗 体 字 强 
调 的 内 容 、 图 表 及 其 标题 。 

阅读 源 代 码 时 ， 首 先 要 看 一 眼 文件 夹 结构 和 文件 名 。 然 后 开始 粗略 地 
通读 文件 内 容 ， 对 定义 了 的 函数 和 类 ， 以 及 经 常 被 调用 到 的 函数 的 名 称 要 
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扫 一 眼 。 

不 管 哪 种 方法 ， 它 们 的 共通 点 都 是 要 先 掌握 概要 再 渐进 式 地 追求 细节 ， 
这 是 大 的 原则 。 

阅读 源 代码 时 的 切入 口 不 一 样 。 其 中 一 种 是 使 用 调试 器 中 的 逐步 执行 功 
能 ， 按 照 执 行 的 顺序 以 及 调用 的 层次 关系 作为 切入 口 去 阅读 的 方法 。 它 也 是 
一 样 地 ， 首 先是 大 致 掌握 程序 的 整个 处 理 流 ， 然 后 逐渐 深入 到 函数 中 的 处 理 
过 程 中 。 

用 这 种 方法 阅读 ， le 这 
ee 种 手段 一 一 从 头 开 始 逐 章 手 抄 ( 详 见 第 12 章 
章 末 专栏 ) 
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容器 和 字符 串 
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容器 有 很 多 种 类 型 。 
为 什么 会 有 这 么 多 类 型 呢 ? 

本 草 会 解释 不 同类 

长 处 和 短处 。 

本 草 后 半 部 分 会 介绍 字符 串 ， 也 就 是 能 放 入 文字 的 容器 。 

文字 是 什么 ?文字 的 符号 化 又 是 什么 ? 我 们 将 边 追 溯 历 史 边 学 习 。 
然后 ， 我 们 会 从 比较 分 析 的 角度 ， 来 学 习 不 同 语言 中 字符 串 的 差异 。 


到 
容器 种 类 多 样 


在 不 同 的 语言 中 ， 容 器 的 名 称 不 同 ， 性 质 各 异 。 比 如 ，C 语言 中 的 
数组 、LISP 语言 中 的 列表 、Python 语言 中 的 元 组 以 及 Ruby 语言 中 的 数 
组 。 即 使 是 名 字 相 同 ， 在 不 同 语 言 中 表达 的 意思 也 可 能 不 一 样 。 比 如 ， 
LISP 语言 和 Haskell 语言 中 的 列表 ， 与 Java 语言 和 了 Python 语言 中 的 列 
表 在 内 部 构造 上 完全 不 同 。 不 同 语言 中 名 称 表达 的 差异 是 导致 混乱 的 根 
源 “。 因 此 ， 本 章 把 这 种 存放 多 个 元 素 的 东西 称 为 容器 。 


(DD LISP 语言 中 的 列表 指 链表 ， 有 时 候 单 说 列表 指 的 就 是 链表 。 而 Java 语言 中 的 列表 
(java.util.List ) 则 是 一 种 有 能 放 入 多 个 元 素 的 功能 的 接口 。java.util.LinkedList<E> 
就 变 成 一 种 链表 ， 这 和 LISP 语言 中 的 列表 概念 就 比较 相近 了 。 元 组 也 是 表示 能 
放 入 多 个 元 素 的 东西 ， 但 Python 语言 中 的 元 组 和 Haskell 语言 中 的 元 组 的 共通 
点 就 很 少 。Python 语言 中 的 元 组 是 不 可 变更 的 列表 ， 而 Haskell 语言 中 的 列表 本 
来 就 是 不 可 变更 的 。Haskell 语言 中 的 元 组 是 可 以 存放 不 同类 型 数值 的 列表 ， 而 
Python 语言 中 的 列表 本 来 就 可 以 存放 不 同类 型 的 数值 。Ruby 语言 中 的 数组 (array ) 
是 “数组 类 ”， 具 有 C 语言 数组 没有 的 很 多 功能 ， 反 而 更 加 接近 Python 语言 中 的 
列表 的 概念 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


9.2 ”为 什么 存在 不 同 种 类 的 容器 | 127 


J 
为 什么 存在 不 同 种 类 的 容器 


为 什么 会 有 不 同 种 类 的 容 船 呢 ? 这 是 因为 各 种 容 泗 兼 具 长 处 和 短处 。 
容 带 中 的 数据 实际 上 是 存放 在 内 存 中 的 。 内 存 束 像 投 币 式 储 物 柜 ， 
由 固定 大 小 的 箱子 按 秩序 排列 ， 并 编 上 序号 (图 9.1) 容 贷 的 类 型 不 
同 ， 内 存 中 存储 数据 的 方式 也 不 同 ， 其 长 处 和 短处 正 是 由 这 些 差 异 而 
来 。 接 下 来 我 们 就 来 看 一 下 存储 数据 方式 的 差异 。 
1 图 9.1 内 存 固定 大 小 的 箱子 按 秩序 排列 并 编 好 序号 
100 101 102 103 104 105 


i 数组 与 链表 


我 们 先 来 比较 两 种 容器 ， 一 种 是 数组 ， 另 一 种 是 链表 “。 

往 数 组 和 链表 中 都 放 入 相同 的 三 个 数据 A、B、C， 内 存 中 会 出 现 什 
么 样 的 情形 呢 ?” 其 模式 图 如 图 9.2。 

在 数组 中 ，A、B、C 按 顺 序 存放 着 ， 非 党 直观 人 简单 。 而 在 链表 中 ， 
存放 了 A 数据 的 下 一 个 箱子 中 还 存放 有 表示 下 一 个 值 在 何 处 的 信息 。 存 
放 C 数据 的 箱子 的 下 一 个 箱子 中 存放 的 是 0， 表 示 没 有 下 一 个 值 了 。 该 
图 表现 了 链表 中 存储 数据 的 两 种 不 同方 式 ， 但 不 管 何 种 方式 ， 我 们 部 可 
以 看 出 A、B、C 三 个 数据 是 按 此 种 顺序 存放 进去 的 。 


QQ) 链表 的 英文 是 Linked List， 发 明 于 1955 年 左右 。 链表 常 被 认为 是 一 种 数据 结构 。 
其 实数 据 结 构 是 一 个 很 宽泛 的 概念 ， 它 不 仅仅 指 能 放 入 多 个 元 素 的 东西 ， 还 包含 
更 广泛 的 含义 。 
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100 101 102 103 104 105 


链接 列表 1 


100 101 102 103 104 105 
A 102 104 人 
链接 列表 2 
100 101 102 103 104 105 
A 104 GC 102 


由 往 数 组 中 插入 数值 
乍 一 看 ， 链 表 的 这 种 数据 存放 方式 要 消耗 两 倍 于 数组 的 内 存 ， 有 些 


浪费 。 然 而 ， 这 种 方式 的 长 处 也 很 明显 。 其 一 就 是 插入 数值 所 需 的 时 
间 。 比 如 要 在 A 和 B 之 间 插 入 数值 z， 该 如 何 操 作 呢 ? 

数组 中 的 存放 方式 是 数值 按 顺 序 排列 存放 的 ， 也 就 是 说 ， 要 先 把 Z 
放 入 101 号 箱子 ， 再 分 别 把 B 和 C 重新 挪 和 人 102 号 和 103 号 箱子 中 
(图 9.3 )。 往 数组 中 插入 数值 时 ， 要 求 把 插入 此 位 置 的 所 有 元 率 都 重新 
挪 到 别 的 位 置 去 ( 复制 )。 
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和 图 9.3 往 数 组 中 插入 数值 需要 进行 复制 


100 101 102 105 104 
四 加西 
复制 复制 
100 101 人 和 总 104 
A 站 © 


这 个 例子 中 因为 数组 中 存放 的 数据 量 不 多 ， 只 需 复 制 两 次 就 可 以 
了 。 但 如 果 要 在 一 个 有 10 000 个 元 素 的 数组 的 初始 位 置 插入 一 个 元 素 ， 
有 要 进行 10 000 次 复制 ， 工 作 量 可 想 而 知 。 

和 往 链表 中 插入 数值 

与 之 相对 地 ， 链 表 不 要 求 在 内 存 中 按 顺 序 存储 ， 而 是 在 内 存 中 同时 
存放 表示 下 一 个 数据 存放 位 置 的 信息 。 

往 链 表 中 插入 数据 ， 首 先 要 在 合适 的 位 置 插入 数据 Z( 图 9.4 )。 

和 图 9.4 ”链表 中 插入 数据 只 需 放 入 两 个 新 的 箱子 并 修改 一 个 箱子 的 内 容 就 OK 


101 变更 102 103 变更 104 10 106 追加 107 退 加 


图 中 是 在 106 位 置 插入 的 箱子 ， 事 实 上 ， 只 要 是 空 着 的 位 置 ， 在 哪 
插入 都 没有 关系 。Z 的 下 一 个 箱子 中 存放 了 Z 的 下 一 个 值 所 在 的 位 置信 
上 县。 该 信息 内 容 是 102， 表 示 下 一 个 值 存放 在 102 位 置 。 最 后 ， 在 101 
号 箱子 中 存放 的 A 的 下 一 个 值 所 在 的 位 置信 息 被 蔡 换 了 ， 换 成 A 的 下 
一 个 值 即 Z 所 在 的 位 置 ， 也 就 是 106 号 箱子 。 
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对 于 链表 来 说 ， 只 需要 添加 两 个 新 的 箱子 并 修改 一 个 箱子 的 内 容 ， 
便 可 以 实现 新 的 元 双 的 插入 。 即 使 有 10 000 个 元 素 ， 这 个 工作 量 也 是 不 
Is 

在 元 素 较 少 时 ， 使 用 数组 还 是 链表 的 差别 并 不 大 。 但 是 随 春 元 系 个 
数 的 增加 ， 数 组 所 需 时 间 不 断 增 加 ， 而 链表 所 需 时 间 却 没有 变化 。 所 以 
对 于 元 素 多 、 搬 人 操作 频 索 的 情况 ， 链 表 是 更 适合 的 。 


和 链表 的 模式 图 

数组 在 内 存 中 的 存储 方式 是 连续 的 ， 大 前 提 就 是 要 有 连续 的 内 存 区 
域 。 而 链表 却 没 有 这 一 要 求 ， 它 可 以 使 用 零散 细 分 的 内 存 区 域 。 与 数组 
不 一 样 ， 对 于 链表 来 次 ， 这 些 零散 的 区 域 在 内 存 中 所 处 的 位 置 并 不 太 重 
要 。 因 此 有 如 图 9.5 所 示 的 一 般 表 现形 式 ， 不 明确 指示 出 在 内 存 的 哪个 
位 置 ， 而 只 是 用 箭头 来 表示 指向 关系 “。 
1 图 9.5 链表 的 模式 图 


A 2 C 
NA 
了 八 
‖ 链表 的 长 处 与 短处 


本 市 我 们 用 大 O 表示 法 来 说 明 链 表 的 长 处 与 短处 。 

链表 的 长 处 是 插入 元 素 的 计算 量 为 0(1)， 而 对 于 数组 是 O(n)。 元 系 
的 删除 同样 如 此 。 链 表 只 需要 修改 表示 下 一 个 元 素 所 在 位 置 的 信息 ， 因 
此 计算 量 为 O()。 而 对 于 数组 则 需要 把 删除 元 素 之 后 的 所 有 元 素 郡 挪 


中 这 里 的 箭头 表示 位 置信 息 ， 类 似 C 语言 中 的 指针 。 但 不 太 园 成 用 指针 这 个 名 称 的 
人 比较 多 ， 这 里 姑且 不 使 用 指针 这 个 词 。 
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位 ， 因 此 计算 量 为 O(n)。 

男 一 方面 ,链表 也 有 其 短处 ， 要 获得 第 n 个 元 素 需 要 花费 较 长 时 
间 。 

因为 数组 中 的 存放 方式 固定 的 ， 因 此 很 容易 得 到 第 n 个 元 素 。 比 如 
要 想 知道 从 100 号 位 置 开 始 的 数组 中 的 第 10 个 元 素 , 在 100 上 加 上 10， 
得 到 的 110 号 位 置 上 读 取 到 的 数据 就 是 它 了 。 这 时 ， 计 算 量 是 O0) 。 

而 链表 可 以 把 各 元 素 存 放 在 喜欢 的 任何 位 置 ， 因 此 无 法 使 用 该 方法 
获得 第 n 个 元 素 。 比 如 要 知道 从 100 号 位 置 开始 的 链表 的 第 10 个 元 素 ， 
首先 要 读 取 最 前 面 的 元 素 ， 找 到 下 一 个 元 素 所 在 的 位 置 ， 再 读 取 下 一 个 
元 素 ， 然 后 再 找到 其 下 一 个 元 素 所 在 的 位 置 ， 如 此 反复 操作 10 次 才 可 
以 得 到 第 10 个 元 素 。 这 时 ， 计 算 量 是 O(n)。 

所 以 说 ， 数 组 和 链表 都 有 各 自 的 长 处 和 短处 。 在 实际 使 用 中 要 留意 自 
己 使 用 的 容器 类 型 和 特点 ， 以 及 它 是 否 和 自己 所 要 达到 的 目的 相符 。 


大 O 表示 法 一 一 简洁 地 表达 计算 时 间 和 数据 量 之 间 的 关系 


在 此 ， 我 们 先 介绍 一 种 能 简洁 方便 地 表达 计算 所 花 时 间 和 数据 量 之 问 关 
系 的 方法 。 

如 果 是 像 数 组 中 的 插入 一 样 的 操作 ， 当 数据 量 n 翻 倍 时 ， 计 算 所 花费 的 
时 间 也 翻 倍 ， 这 种 性 质 用 O(n) 表示 ， 读 作 的 数量 级 “。 

而 如 果 是 像 链 表 的 插入 一 样 的 操作 ， 即 使 数据 量 n 翻 倍 ， 计 算 所 花 时 间 
也 不 变 ， 这 种 性 质 用 O(1) 表示 ， 读 作 常 数 的 数量 级 “。 

除 此 之 外 ， 当 数据 量变 为 2 倍 、3 倍 时 ， 计 算 时 间 增 加 到 4 倍 、9 倍 ， 
这 个 用 O(n”) 表示 ， 当 数据 量变 成 2 倍 时 增加 的 计算 时 间 ， 和 数据 量 从 2 倍 


(D 数组 的 第 一 个 元 素 称 为 第 0 个 。 

@ 本 专栏 仅 针对 大 O 表示 法 进行 大 致 说 明 ， 在 此 不 涉及 严密 的 定义 ， 读 者 可 以 从 
其 他 著作 中 了 解 。 如 《C 语言 忆 上 上马 最 新 了 儿 了 中 天 和 人 事 典 》( 中 文 译 名 : 基于 
最 新 算法 的 C 语言 实现 大 全 ) 一 书 中 关于 O(n) 有 如 下 解释 : 对 于 常数 C (>0 )， 
如 果 存在 数 W， 使 得 当 1sEN 时 |/a 三 clg(D| 一 定 成 立 ， 那 么 当 n 一 % 时 fl(n) = 
O(g(n)) 成 立 。 

(3) 也 称 作 线性 时 间 。 

由 也 称 作 常 数 时 间 。 
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增加 到 4 倍 时 增加 的 计算 时 间 相 同 ， 这 种 情形 用 O(log m) 表示 。 对 于 大 量 数 
据 ， 进 行 for 循环 是 O(n)， 进 行 二 重 for 循环 是 O(n”)。 

随 着 nn 的 增 大 ， 大 致 有 以 下 关系 : 

ODZOlog pn <OW ON) 

这 种 表达 方式 只 是 非常 粗略 地 表现 出 函数 的 增加 速度 和 方式 ， 因 此 不 
管 是 02+27+1 还 是 3 n“ 都 表达 为 O(n )。 这 样 写 是 为 了 省 去 一 些 细节 。 


语言 的 差 恒 


在 Java、Python、Ruby 等 语言 中 都 将 数组 作为 一 种 最 基本 的 容器 
标准 “。 比 如 Python 语言 中 的 [1, 2, 3]， 里 面 的 元 素 在 内 存 中 是 排列 好 
存放 的 。 

与 此 相对 应 ,在 LISP、Scheme、Haskell 等 语言 中 都 将 链表 作为 一 
种 最 基本 的 容器 。LISP 语言 中 的 (1 2 3) 和 Haskell 语言 中 的 [1, 2, 3] 表达 的 
是 当前 值 以 及 下 一 个 值 存放 位 置信 息 的 集合 。 

不 言 而 喻 ， 大 多 数 语 言 中 的 容 右 都 是 在 库 中 提供 的 。Python 语言 中 
的 collection.deque 是 使 用 链表 的 容器 ”“，Haskell 语言 中 的 Data.Array 是 使 
用 了 数组 的 容 需 。 


pe 


字典 、 散 列 、 关 联 数组 


本 届 我 们 来 看 为 一 种 诸多 语言 部 文 持 的 容 胡 ， 它 被 称 作 子 典 、 散 列 
或 关联 数组 等 “。 


(D 数组 在 对 象 的 包装 下 辅 以 一 些 便 利 的 操作 方法 的 情况 很 多 见 。 

@ 准确 来 讲 ， 前 面 介绍 的 链表 包括 下 一 个 数值 的 位 置信 息 ， 而 Python 语言 的 deque 
在 此 基础 上 还 包括 前 一 个 数值 的 位 置信 息 ， 是 一 种 双向 链表 。 

@B) 在 脚本 语言 中 常用 散 列 一 词 来 指 代 这 种 容器 。 它 源 自 于 字典 实现 方式 之 一 的 散 列 
表 ， 因 此 严格 来 讲 把 它 和 字典 并 列 起 来 并 不 合适 。 为 了 使 本 章 内 容易 于 理解 ， 暂 
且 这 样 处 理 。 
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本 章 使 用 字典 这 个 词 。 字 典 和 上 一 节 中 学 习 的 数组 有 什么 区 别 呢 ? 
数组 是 整数 和 值 的 对 应 。 当 被 问 到 第 10 个 数值 是 多 少时 ， 它 能 告知 第 
10 个 数值 是 3。 与 之 相对 应 ， 罕 典 是 字符 串 和 数值 的 对 应 。 当 被 问 到 
"age" 的 值 是 多 少时 ， 它 能 告知 "age" 的 值 是 31 (图 9.6)。 这 里 的 字符 串 
被 称 作 字典 的 “ 键 ” 。 笔 者 认为 字典 这 一 名 称 很 自然 就 能 让 人 想起 字符 
串 和 值 的 对 应 关系 “。 


1 图 9.6 ”数组 与 字典 


我 们 来 看 一 个 具体 的 例子 。 有 三 个 小 孩 ， 名 字 分 别 是 Ichiro、 
Hanako 和 Jiro， 年 龄 分 别 为 5 岁 、4 岁 和 3 岁 。 我 们 来 考虑 一 下 如 何在 
内 存 上 记录 他 们 名 字 和 年 龄 的 对 应 情况 。 实 现存 放 多 个 数值 的 目的 的 方 
法 有 数组 和 链表 这 两 种 。 同 样 地 ， 实 现 字 符 串 和 值 对 应 存储 的 也 有 多 种 
实现 方法 。 笛 用 的 方法 是 散 列 表 和 树 。 


和 仇 列 表 
散 列表 使 用 以 字符 申 为 参数 返回 整数 的 散 列 函数 ， 实 现 了 字符 申 与 
值 的 对 应 。 存 放 值 之 前 首先 准备 一 个 大 的 数组 ， 然 后 使 用 散 列 函 数 (分 


QD 在 实现 中 ， 字 典 中 的 键 也 可 以 是 字符 串 以 外 的 东西 ， 像 Python 语言 中 就 可 以 。 这 
一 点 跟 此 处 论述 的 主题 无 关 ， 因 此 不 多 欧 述 。 

@ 敏锐 的 读者 可 能 一 下 子 想起 了 第 7 章 中 出 现 的 名 字 和 内 容 的 对 照 表 ， 两 者 颇 
为 相似 。 的 确 如 此 ， 对 照 表 (命名 空间 ) 和 字典 在 功能 上 是 等 价 的 。“Python 
Reference Manual” (http://docs.python.org/release/1.6/ref/execframes.html) 中 有 如 下 
论 述 : Namespaces are functionally equivalent to dictionaries (and often implemented 


as dictionaries). 
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散 函 数 ”) 将 字符 串 转 换 成 适当 分 散 的 整数 ,用 来 决定 这 个 值 在 数组 中 存 
放 的 位 置 。 

首先 使 用 散 列 函数 把 键 转换 为 整数 n。 比 如 Ichiro 是 434，Hanako 
是 522，Jiro 是 110. 经 过 这 样 的 转换 后 ， 青 把 值 存 入 数组 的 第 nn 个 位 置 
中 (图 97) 2。 


1 图 9.7 散 列 表 


大 的 数组 


0 
| DC 
NN .FE 
一 ”| CACE 


434[ 


| 树 


如 图 9.8 所 示 ， 树 是 一 种 数据 结构 。 链 表 中 用 第 头 连接 了 下 一 个 值 ， 
而 树 用 箭头 连接 了 右边 子 树 和 左边 子 树 两 处 。 因 为 在 制作 图 表 时 一 般 会 
习惯 性 地 回 下 措 绘 ， 所 以 与 其 说 是 树 不 如 说 更 像 是 树 根 。 


QD 分 散 函 数 这 个 名 称 最 早出 现 于 1980 年 的 《信息 处 理 手册 3 日 本 信息 处 理学 会 编 )。 
这 个 词 非常 直观 地 表达 了 函数 的 目的 ， 但 目前 最 为 广泛 的 称呼 还 是 散 列 函数 。 

@ 这 里 仅仅 介绍 了 概要 ， 在 实际 的 实现 过 程 中 会 磁 到 几 个 坏 手 的 问题 。 比 如 ， 不 同 
的 键 传 递 给 散 列 函数 碰巧 得 到 相同 的 内 存 地 址 该 怎么 办 ? 又 如 ， 为 了 得 到 分 散 的 
整数 返回 值 该 选用 怎样 的 散 列 函数 ? 再 如 ， 事 先 准 备 好 的 数组 多 大 才 合适 ? 对 这 
些 问题 感 兴趣 的 读者 可 以 阅读 一 些 与 散 列 表 实 现 相 关 的 文献 。 

(3) 树 最 上 面 的 节点 叫 根 ， 箭 头 的 尾 端 叫 父 节点 ， 尖 端 叫 子 节点 。 子 节点 最 多 两 个 的 
树 被 称 为 二 又 树 。 一 般 的 树 也 可 能 有 三 个 以 上 的 子 节点 。 第 3 章 中 我 们 曾经 讲 到 
过 结构 树 ， 本 章 讲 的 是 二 又 树 。 
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1 图 9.8 树 的 结构 


左 右 值 
左 右 值 右 值 
右 值 左 五 值 左 五 值 左 五 值 


我 们 来 看 一 下 树 的 构造 过 程 。 首 先 把 Ichiro 作为 根 节 点 ， 如 图 9.9。 


1 图 9.9 以 Ichiro 为 根 节点 


名 字 
Ichiro 


再 追加 Hanako 这 个 元 素 。 基 本 原则 是 键 小 的 放 在 左边 ， 键 大 的 放 
在 右边 。 把 Ichiro 和 Hanako 这 两 个 键 按 照 字 典 序 比较 ， 可 知 瑟 在 I 的 
前 面 ， 因 此 Hanako 要 比 Ichiro 小 ， 在 其 左边 (图 9.10 )。 


1 图 9.10 Hanako 在 Ichiro 的 左边 


和 年 龄 
Te 


年 龄 


TT 


然后 追加 Jiro 这 个 元 素 。Jiro 因为 比 Ichiro 更 靠 后 ， 因 此 在 其 右边 
(图 9.11 )。 
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1 图 9.11 Jiro 在 Ichiro 的 右边 


左 右 ”名字 ”年龄 
Tel 


年 龄 左右 和 下 


Tree 


然后 追加 Saburo 这 个 元 素 。 首 先 比较 Saburo 和 Ichiro，S 在 I 后 
面 ， 因 此 往 右前 进 。 右 边 已 经 有 了 Jiro。 比 较 Jiro 和 Saburo，S 在 J 的 
后 面 ， 因 此 放 在 其 右边 。 

读 取 数值 时 ， 也 要 做 同样 的 比较 。 比 如 要 把 Jiro 这 个 键 对 应 的 值 读 
取出 来 ， 首 先 要 比较 Ichiro 和 Jiro。Jiro 在 后 面 ， 因 此 顺 关 右边 的 租 头 
前 进 。 然 后 比较 Jiro 和 Jiro， 他 们 是 相同 的 ， 从 而 得 到 此 处 记录 的 3 就 
是 和 Jiro 相对 应 的 数值 ”。 


I 元 素 的 读 取 时 间 


不 搞 这 么 复杂 ， 使 用 两 个 数组 不 也 行 吗 ? 或 者 说 ， 在 数组 里 按键 - 
值 - 键 - 值 这 种 方式 存放 数据 不 也 可 以 吗 ? 抱 有 这 种 想法 的 人 应 该 不 在 
少数 吧 。 

元 素 的 数量 较 少 时 这 样 做 是 没有 问题 的 。 至 于 给 定 键 读 取 对 应 的 值 
时 所 需 时 间 是 多 少 ， 我 们 从 大 0 表示 法 的 角度 来 探讨 一 下 。 在 数组 里 存 
放 键 和 值 的 这 种 方式 中 ， 要 读 取 特定 键 对 应 的 值 时 ， 因 为 不 知道 键 存 放 
a 
能 找到 ， 或 许 要 到 最 后 才能 找到 ， 平 均 需 要 进行 n/2 次 的 检查 。 因 此 ， 
数量 级 为 O(n)”。 


@ 这 里 仅仅 介绍 了 概要 ， 在 实际 的 实现 过 程 中 会 碰 到 几 个 棘手 的 问题 。 这 种 方法 中 
如 果 没 有 很 好 地 平衡 树 的 左右 两 边 ， 则 可 能 产生 性 能 问题 。 比 如 ， 对 于 一 个 对 键 
按 降 序 排序 好 了 的 树 , 它 只 会 往 左 边 一 个 方向 成 长 。 怎 么 保持 左右 两 边 的 平衡 呢 ? 
有 兴趣 的 读者 可 以 通过 关键 字 平 街 二 又 树 或 是 红 思 树 查 找 相关 文献 

@ 可 能 有 读者 会 说 ， 将 数组 按照 键 的 升序 先 排序 好 ， 采 用 二 分 查找 的 办 法 ， 时 间 复 
ye 的 确 如 此 。 但 是 考虑 到 元 素 添加 的 过 程 ， 如 何 才能 
保持 数组 的 已 排序 状态 呢 ? 这 又 会 回 到 平衡 二 又 树 的 话题 。 
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有 对 于 树 

从 树 中 访 取 元 素 是 什么 情况 呢 ? 在 前 面 的 例子 中 我 们 构造 了 一 个 市 
有 3 个 元 素 的 树 。 从 这 棵 树 中 读 取 1 个 所 需 数 据 ， 最 多 需要 比较 两 次 。 
比如 要 把 Hanako 对 应 的 值 谈 取出 来 ， 首 先 把 Hanako 和 根部 的 Ichiro 进 
行 比 较 ， 这 是 第 一 次 。 接 下 来 ， 因 为 Hanako 比 Ichiro 要 小 ， 于 是 沿 着 
左边 的 箭头 找到 下 一 个 ， 再 和 Hanako 做 比较 ， 这 是 第 二 次 。 高 度 为 2 
的 树 中 最 多 有 3 个 元 素 "。 

比较 次 数 增 加 1 次， 能 最 多 从 多 少 个 元 素 中 该 取 某 个 元 素 呢 ? 高 度 
为 3 的 树 中 最 多 能 有 多 少 个 元 素 呢 ? 答案 是 113*2 =7 个 。 把 它 想象 为 
一 个 根部 左右 两 边 都 是 一 棵 高 度 为 2 的 树 的 树 。 那 这 棵 树 的 元 对 就 是 由 
根部 的 1 个， 加 上 高 度 为 2 的 树 中 的 3 个 ， 再 加 上 左边 高 度 为 2 的 树 中 
的 3 个 ,总 共 7 个 。 

那么 ， 高 度 为 4 的 树 最 多 又 能 有 多 少 个 元 素 呢 ? 答案 是 1+7*2= 15 
个 。 假 设 一 棵 树 它 的 根部 左右 两 边 都 是 一 棵 高 度 为 3 的 树 。 它 的 元 素 个 
数 就 是 由 根部 的 1 个 ， 加 上 高 度 为 3 的 树 中 的 7 个 ， 再 加 上 左边 高 度 为 
3 的 树 中 的 7 个 ， 总共 15 个 (图 9.12 )。 


有 1 图 9.12 比较 4 次 ， 可 以 从 15 个 元 素 中 读 取出 某 个 特定 的 元 素 


me 
EN WR 由 


加 IE 

像 这 样 ， 树 的 高 度 每 增加 1， 元 素 的 数量 就 大 致 变 成 2 倍 。 反 之 ， 
每 当 数据 量 翻 倍 时 ， 所 需 的 比较 次 数 就 增加 1 次 。 也 就 是 说 ， 从 树 中 读 
取 元 素 的 所 需 时 间 是 O(log 四? 。 


(DD 本 章 讲 的 不 是 一 般 的 树 ， 而 是 子 节点 最 多 为 两 个 的 二 又 树 。 
@ 要 获得 O(logn) 的 性 能 ， 必 须 保证 树 的 左右 两 边 的 平衡 。 如 果 向 一 边 偏 移 ， 最 坏 
的 情况 性 能 可 能 降 为 O(n)。 
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目 对 于 散 列 表 

在 散 列 表 中 又 是 什么 情况 呢 ?” 要 把 键 对 应 的 值 读 取 出 来 ， 首 先 要 经 
过 散 列 函 数 把 键 转换 成 数组 中 的 位 置信 息 ， 再 把 该 位 置 上 的 信访 取出 
来 。 这 个 操作 与 数据 的 量 没 有 关系 ， 也 就 是 0(1) 的 数量 级 “。 

所 以 散 列 表 所 需 时 间 数 量 级 是 最 小 的 。 正 因为 如 此 ， 很 多 语言 中 在 
制作 字典 时 都 会 使 用 散 列 表 。 从 内 存 的 占用 量 来 看 ， 借 助 数组 的 方法 所 
需 内 存 最 少 ， 而 散 列 表 为 了 存放 值 需 要 很 大 的 数组 ， 因 此 内 存 的 占用 量 


是 最 大 的 。 


i 没有 万 能 的 容器 


也 许 有 人 要 问 ， 那 到 底 用 什么 容器 好 呢 。 事 实 上 ， 万 能 的 容器 是 不 
存在 的 。 根 据 容 融 的 使 用 目的 、 使 用 方式 和 操作 类 型 的 不 同 ， 最 适宜 的 
容 需 类 型 也 会 相应 地 变化 。 是 想 要 节约 内 存 、 节 约 计算 时 间 ， 还 是 两 样 
都 没有 必要 节约 。 没 有 绝对 的 正确 答案 ， 而 是 需要 根据 当时 的 状况 仔细 
分 析 ， 寻 求 最 佳 平衡。 这 是 非常 重要 的 。 

比如 你 需要 写 一 个 针对 用 户 操作 做 出 响应 的 程序 。 如 采 在 不 考虑 处 
理 速度 的 情况 下 0.01 秒 可 以 处 理 完毕 ， 那 么 对 于 这 个 程序 还 有 必要 做 高 
速 化 处 理 吗 ? 

要 回答 这 个 问题 ， 需 要 重点 考虑 两 点 : 什么 有 增加 的 可 能 性 ， 以 及 
其 时 间 复 杂 度 是 什么 数量 级 。 比 如 开发 环境 中 只 有 10 个 数据 ， 用 户 实际 
使 用 的 环境 中 有 10 万 个 数据 。 如 果 你 写 的 程序 的 处 理 时 间 复 杂 度 是 
0(1)， 那 么 即使 数据 有 10 万 个 ， 你 也 能 在 0.01 秒 内 处 理 完 毕 。 这 种 情况 
下 ， 即 使 花费 精力 把 处 理 速度 提升 两 倍 ， 时 间 缩 短 到 0.005 秒 ， 在 用 户 满 
意 度 提升 方面 带 来 的 效益 也 十 分 有 限 。 但 是 如 果 你 写 的 程序 的 处 理 时 间 
复杂 度 是 O(n)， 那 么 数据 量变 为 10 万 个 时 ， 处 理 时 间 就 要 100 秒 。 耗 时 
100 秒 用 户 能 接受 么 ?如果 不能 ， 那 就 有 进行 高 速 化 处 理 的 必要 了 “。 


由， 然而， 如果 散 列 函数 的 结果 分 散 度 比较 差 ， 或 者 为 值 准备 的 数组 太 小 ， 那 么 不 同 
的 键 的 散 列 值 碰巧 落 入 一 个 内 存 地 址 的 概率 就 会 增高 。 这 时 为 了 不 返回 错误 的 值 ， 
就 要 额外 花费 更 多 的 时 间 。 

@ 即使 不 能 做 高 速 化 处 理 ， 至 少 也 要 花 点 工夫 显示 一 个 进度 条 。 
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0.4 
什么 是 字符 
字符 串 是 什么 ”本 节 我 们 会 追溯 到 计算 机 诞生 以 前 ， 了 解 何 为 字 


伯 ， 并 学 习 子 符 集 和 和 字符 的 编码 方式 。 字 符 串 一 词 所 指 的 内 容 在 不 同 语 
言 中 差异 很 大 。 


| 字符 集 和 字符 的 编码 方式 


因 国家 和 文化 不 同 ， 提 到 字符 ， 大 家 关联 到 的 事物 可 能 差异 很 大 。 
在 英国 ， 人 们 可 能 会 关联 到 abc 等 字母 。 在 法 国 ， 人 们 除了 会 关联 到 字 
母 ， 可 能 还 会 想到 ce、c¢ 这 样 的 特殊 字符 。 

韩国 人 可 能 把 Hangul ( 韩文 字母 ) 当 作 字符 ， 而 日 本 人 则 会 把 平 
假名 、 片 假名 和 汉字 当 作 字符 。 那 今 是 字符 吗 ? J 是 字符 吗 ? ” 又 是 字 
符 吗 ? 

说 到 底 ， 字 符 只 不 过 是 人 们 约定 好 的 命名 为 字符 的 一 系列 符号 的 集 
合 而 已 。 这 一 符号 的 集合 被 称 为 字符 集 或 字符 包 。 字 符 集 因 国 家 和 文化 
不 同 千差万别 。 

另 一 方面 ， 要 将 字符 集 通 过 数字 化 的 数据 表现 出 来 ， 就 必须 考虑 如 
何 对 字符 进行 编码 。 编 码 方式 也 只 不 过 是 人 们 约定 的 一 系列 规则 ， 有 些 
甚至 可 能 是 随意 决定 的 。 比 如 ， 平 假名 中 的 大 用 + = “表示 ， 这 一 规则 
就 是 随意 决定 的 。 编 码 方式 必须 为 字符 编码 方 和 编码 解码 方 共有 ， 和 没 
有 掌握 这 一 编码 方式 的 人 是 无 法 进行 信息 交互 的 。 

字符 编码 方式 的 发 展 历程 ， 是 两 种 观点 相互 角力 的 历史 。 一 种 观点 
认为 应 该 按 效 率 和 满足 个 别 需 求 的 原则 创造 新 的 编码 方式 ， 与 此 针 锋 相 
对 的 观点 认为 过 多 的 编码 方式 为 信息 交互 带 来 不 便 ， 应 该 进行 标准 化 。 
接 下 来 我 们 回顾 一 下 这 段 历史 。 


(DD 2002 年 左右 在 年 轻 女 性 中 流行 的 “少女 字符 ”中 就 用 + = 来 表示 大 。 人 和 仔细 看 来 ， 
它 和 平 假名 中 的 大 确实 有 些 形似 。 
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和 摩 斯 码 
在 电影 等 一 些 场合 ,我们 经 常会 见 到 摩 0 它 把 用 
是 证 ee 过 控制 与 


无 线 发 报 机 相连 的 按键 的 “ 通 ”与 “ 断 ” 信 和 号 el 


图 9.13 几 个 字符 的 摩 斯 码 表达 


^ 国 

: 
° DB HS 
> 国 国 国 

°° ED SS OS 


摩 斯 码 用 短 时 间接 通 的 短 点 和 是 其 3 倍 时 长 的 接 通 的 长 点 的 组 合 来 
表达 字符 。 短 点 和 长 点 之 间 要 夹带 断 开 状态 ， 否 风 点 与 点 之 间 就 没有 了 
界限 ， 会 变 得 无 法 区 分 和 理解 。 点 之 间 的 断 开 状态 时 长 是 1 个 短 点 ， 字 
符 间 是 3 个 短 点 ， 词 语 间 则 是 7 个 短 点 。 

按照 这 种 方式 来 编码 求救 信号 SOS 时 ， 字 符 串 会 有 多 长 呢 ? S 是 
题 “ 题 “大 有 站 是 局 时 长 9 是 长 长 下， 有 且 帮 下 反 因 长 ， 抽 
加 上 字符 间 的 短 点 时 长 ， 总 共有 5+3+11+3+5=27 个 “。 


(DD 摩 斯 符号 ( 摩 斯 信号 ) 这 种 编码 方式 发 明 于 1836 年 左右 ， 于 1865 年 由 International 
Telegraphy Congress 纳 为 一 种 国际 标准 中 一 。 

@ 1836 年 摩 斯 思考 出 的 符号 和 在 1865 年 标准 化 的 符号 在 C 和 下 等 部 分 字符 和 数字 
的 编码 方式 上 有 差别 。 

@) 在 实际 的 电信 通讯 中 ,会 将 SOS 作为 特殊 信息 进行 处 理 ， 规 定 在 S 和 OO 之 间 仅 
保留 一 个 短 点 时 长 。 在 与 其 他 种 编码 方式 进行 效率 比较 时 ， 暂 不 考虑 电信 中 的 特 
殊 情 况 。 
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号 ,其 中 字母 
符 的 话 成 本 较 


能 用 摩 斯 码 编码 的 字符 集 有 字母 、 数 字 和 其 他 一 些 符 
不 区 分 大 小 写 。 仿 计 当 时 人 们 认为 为 区 分 大 小 写 而 增加 字 
高 ， 权 衡 之 后 决定 不 区 分 了。 


目 博多 码 

摩 斯 码 是 基于 手动 按压 开关 送信 然后 通过 耳 条 接收 的 设想 而 设计 出 
来 的 一 种 编码 方式 。 使 用 这 种 方式 ，1 秒 钟 能 送出 的 量 和 能 接收 的 量 都 很 
有 限 。 随 着 通信 和 需求 的 不 断 提 高 ， 迫 切 需 要 一 种 更 为 高 速 的 通信 方法 。 

于 是 后 来 出 现 了 电 传 打字 机 终端 。 把 打字 机 与 电话 线 相连 ， 通 过 敲 
击 键盘 输入 字符 ， 接 收 端 通过 打印 机 输出 接收 到 的 字符 。 后 来 ， 针 对 大 
量 信息 交互 的 更 为 高 速 的 通信 和 需求， 出现 了 纸 囊 穿孔 机 和 旋 取 设备 相连 
接 的 方式 。 人 们 把 需要 传送 的 信息 用 穿孔 纸 市 上 的 孔 点 记述 下 来 ， 设 备 
读 取 这 些 孔 点 后 再 把 信息 传送 出 去 。 

电 传 打字 机 终端 连接 的 国际 通信 了 网络 叫 电 传 网 ， 于 1931 年 首次 提 
供 服 务 。 电 传 网 使 用 的 编码 方式 是 博多 码 ， 它 在 1905 年 被 提出 ， 在 
1931 年 成 为 了 一 种 标准 规格 。 

博多 码 的 特征 是 ， 一 个 字符 由 $ 个 通 与 断 (5 比特 ) 的 组 合 来 表现 
(图 9.14 )。 也 就 是 说 ，SOS 只 需要 15 个 比特 就 能 表示 了 。 这 大 约 是 摩 
斯 码 的 一 半 ， 似 乎 是 一 种 效率 更 高 的 通信 手段 。 博 多 码 的 字符 集 由 大 写 
字母 、 数 字 和 一 些 其 他 符号 组 成 。 突 出 特点 是 它 在 字符 集中 添加 了 空格 
(不 打印 输出 只 是 将 光标 回 右 移动 一 个 字符 位 置 的 命令 )、 换 行 ( 光标 问 
一行 移动 的 命令 )、 归 位 《光标 同行 首 移动 的 命令 ) 等 控制 码 。 


1 图 9.14 几 个 字符 的 博多 码 表 达 


^ [加 
” 国 量 | 必 
° (BO 
° 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


然而 ，5 个 比特 只 能 表达 最 多 32 个 字符 。 字 母 26 个 ， 数 字 10 个 ， 
加 起 来 就 已 经 是 36 个 了 。 那 么 如 何 实 现 5 个 比特 表达 1 个 字符 的 目 
标 呢 ? 

答案 是 使 用 切换 。 事 先 定 义 好 此 处 是 由 数字 模式 的 比特 列 (FIGS ) 
起 始 还 是 字母 模式 的 比特 列 (LITRS ) 起 始 ， 再 实现 两 种 模式 的 切换 。 
这 种 切换 叫做 shift。 比 如 10011 这 一 比特 列 ， 在 字母 模式 下 意思 是 W， 
在 数字 模式 下 意思 变 成 2. 


| EDSAC 的 字符 编码 


我 们 终于 要 开始 展开 与 计算 机 有 关 的 话题 了 。 电 传 网 出 现 大 约 20 
年 后 ，1949 年 ， 一 种 叫做 EDSAC 的 计算 机 问世 了 。EDSAC 和 电 传 网 
一 样 ， 用 5 个 比特 来 表达 1 个 字符 ， 并 且 也 用 一 排 开 有 5 个 孔 点 的 纸 市 
进行 输入 。 这 种 计算 机 应 该 比较 容易 生产 。 然 后 ， 将 数字 与 字母 通过 
shift 切换 输出 。 这 一 点 和 博多 码 的 理念 是 一 致 的 。 但 是 ， 哪 个 字符 分 配 
到 哪个 比特 列 的 分 配方 式 和 博多 码 是 不 一 样 的 。 


| ASCI| 时 代 和 EBCDIC 时 代 


EDSAC 出 现 后 的 十 年 间 出 现 了 各 式 各 样 的 计算 机 ， 它 们 使 用 的 字 
符 的 编码 方式 也 各 不 相同 。 这 样 一 来 ， 在 一 种 计算 机 上 读 取 其 他 种 计算 
机 输出 的 字符 时 ， 就 需要 一 个 个 的 转换 ， 十 分 有 麻烦。 为 了 更 轻松 地 实现 
字符 间 的 转换 ， 人 们 展开 了 将 计算 机 字符 编码 方式 标准 化 的 运动 。 这 就 
是 ASCI 人 码 ， 它 是 American Standard Code for Information Interchange 的 
缩写 ， 也 就 是 信息 交互 的 美国 标准 符号 ， 于 1963 年 被 制定 出 来 。 

ASCII 中 ,1 个 字符 用 7 个 比特 进行 编码 。7 个 比特 可 以 表达 128 
个 字符 ， 因 此 不 再 需要 切换 。ASCII 码 的 字符 集 比 EDSAC 大 很 多 ， 包 
括 大 量 的 符号 、 控 制 码 以 及 小 写字 母 。 

如 果 计 算 机 的 后 产 商 都 统一 使 用 ASCII 码 ， 那 么 信息 的 交互 就 能 变 
得 很 轻松 。 这 应 该 就 是 当初 的 理想 ， 然 而 现实 与 理想 是 有 差距 的 。 在 
ASCII 码 制定 的 1963 年 ， 当 时 在 计算 机 制造 市 场 拥 有 大 多 数 份额 的 
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IBM 公司 公布 了 与 ASCII 码 不 同 的 8 比特 编码 方式 。 这 就 是 EBCDIC 
(图 9.15 )。 


1 图 9.15 ASCII 码 和 EBCDIC 码 中 大 小 写字 母 和 符号 的 编码 方式 


字符 集 字符 编码 方式 符号 


A 
摩 斯 码 B 
Cc 


ASCII A:41、a:61、2Z:5A、1:21 
EBCDIC A:C1、 a:81、Z:E9、1:5A 


如 果 大 家 都 使 用 同一 种 方法 当然 是 更 好 的 ， 但 大 公司 往往 主张 大 家 
去 使 用 它们 自家 产品 的 方法 。 到 现在 之 所 以 也 有 很 多 用 户 在 使 用 这 家 公 
司 的 产品 的 执行 方法 ， 其 中 一 个 理由 就 是 因为 迁移 成 本 太 高 。 而 使 用 其 
竞争 厂商 的 产品 的 用 户 往往 十 分 艰难 ， 这 加 剧 了 拥有 多 数 市 场 份额 的 公 
司 进一步 获取 更 多 用 户 “。 

最 后 ， 统 一 编码 方式 的 理想 未 能 实现 ，EBCDIC 自身 也 出 现 了 很 多 
种 亚 种 。 比 如 ， 比 特 列 01011010 对 应 的 字符 ,在 HP 的 EBCDIC 中 
是 ], 在 IBM 的 EBCDIC 中 是 ! ,而 在 ASCII 中 则 是 Z 。 


(D EBDIC 是 Extended Binary Coded Decimal Interchange Code 的 简称 ， 和 这 里 的 主题 
关系 不 大 。 字 符 集 和 ASCII 码 不 完全 一 致 , 但 就 能 显示 的 字符 来 说 基本 是 相同 的 ， 
这 里 做 简单 处 理 。 

@ 这 个 不 仅 限于 发 生 在 IBM 身上 ， 在 操作 系统 市 场 巨 头 的 微软 公司 和 智能 手机 巨头 
的 苹果 公司 身上 也 发 生 着 类 似 的 事情 。 

BB) 说 慎 起 见 ， 这 里 也 把 公司 全 名 写 出 来 。IBM 是 International Business Machine 
Corporation 的 略称 ，HP 是 Hewlett-Packard Company ( 惠普 公司 ) 的 略称 。 两 者 
都 是 著名 的 计算 机 生产 厂商 。 时 至 2012 年 ， 即 使 使 用 略称 相信 大 家 也 能 明白 。 
笔者 于 上 世纪 80 年 代 写 的 一 篇 文章 中 用 了 “世界 上 首次 量 产 计 算 机 的 RR 公司 ”， 
结果 有 不 少 读 者 没有 认 出 来 ， 这 还 曾 让 我 烦恼 过 。 正 确 答案 是 Reminton Rand。 
它 在 1955 年 合并 后 改 成 了 别 的 名 称 ， 之 后 又 再 次 发 生 合并 ， 演 变 成 了 今天 的 
Unisys Corporation 。 
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日 语 的 编码 


计算 机 的 使 用 进一步 普及 ， 了 逐渐 延伸 到 企业 的 业务 领域 ,于 是 众生 
了 新 的 需求 。 这 不 仅 是 ASCII 中 能 表达 的 字母 、 Cn 也 有 对 日 
语 字 人 符 表达 的 需求 。 然 而 ， 一 个 字 廊 (8 比特 ) 最 多 只 能 表达 256 种 和 从 
及 ， 于 是 开始 了 使 用 多 个 字 节 表达 日 语 中 的 字符 。 

这 种 编码 方式 也 有 很 多 种 类 型 。 这 里 介绍 三 种 现在 也 频繁 出 现 的 类 
型, ISO-2022-JP*、Shift JIS? 和 EUC-JP”,“， 

图 9.16 展现 的 是 将 aaa 加 为 为 aaa 用 各 种 编码 方式 转换 为 字 节 序列 
的 情形 


1 图 9.16 三 种 编码 方式 中 aaa 办 加 加 aaa 的 编码 


0 JP 

a _ 切换 命令 _ 切换 命令 
Shift-JIS 
aa 区 多 加 a a a, 
回回 回回 四 加 O00 


Eb 0 


加 站 


(DD 也 俗称 JIS 码 等 。 

@ “Windows 中 使 用 的 是 JIS” 的 这 种 说 法 并 不 正确 。 严 格 来 讲 ， 是 微软 公司 对 
Shift JIS 进行 了 扩展 ， 在 Windows 中 使 用 了 并 不 具有 完全 互 换 性 的 Windows-31J 
(或 称 为 CP932 )。 

(3) EUC 是 Extended UNIX Code 的 略称 。 除 EUC-JP 外 ,还 有 针对 韩语 的 EUC-KR 等 。 

(4) 本 章 一 直 使 用 “编码 方式 ”这 一 用 词 。 EN encode ,用 entcode 来 表示 “使 
之 成 为 编码 ”的 意思 。 也 有 称 Shift JIS 等 编码 方式 为 字符 码 的 叫 法 。 
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1SO-2022-JP 

在 ISO-2022-JP 编码 方式 中 ，aaa 和 为 为 为 之 间 有 不 与 任何 字符 对 应 
的 3 个 字 节 ， 在 图 中 用 灰色 显示 。 这 是 在 博多 码 和 EDSAC 中 使 用 的 切 
换 命 令 ， 用 来 切换 显示 字母 的 模式 和 显示 平 假名 的 模式 。 

在 字母 和 符号 用 1 个 字 世 表示 的 模式 中 ，24 是 $，22 是 " 。 前 面 添 
上 切换 命令 ( 1b 24 42， 以 下 代码 中 是 \xlb$B ) 之 后 ， 进 入 平 假名 表达 
模式 ，24 22 作为 整体 ， 被 识别 为 力 。 
于 


> Fine "SM I eCode( lieso 2022510") 
> 

Srinen esesu ueeedelQ se S00 
世上 入 区 


目 Shift_JIS 

ISO-2022-JP 中 单字 节 的 字符 $ 和 双 字 节 的 字符 为 的 前 面 一 个 字 节 
都 是 24。Shift_JIS 编码 约定 ， 用 于 表现 单字 节 的 字符 的 字 节 不 会 被 用 在 
双 字 节 的 字符 的 前 面 一 个 字 节 上 。 比 如 ， 轴 前 面 一 个 字 节 是 82， 它 没有 
用 于 任何 一 个 单字 节 的 字符 。 于 是 ， 即 使 没有 切换 命令 也 可 以 进行 这 样 
的 判断 : 这 个 字符 不 是 用 来 表达 单字 市 字符 的 ， 而 是 双 字 节 字 符 前 面 的 


个 空 备 


| 


目 EUC-JP 
EUC-JP 编码 约定 ， 双 字符 字符 中 的 第 一 个 字 节 和 第 二 个 字 贡 都 不 
出 现在 单字 节 字 符 的 表达 中 。 


| Shift_JIS 编码 对 程序 的 破坏 


Shift_JIS 编码 和 EUC-JP 编码 的 区 别 在 于 ， 双 字 节 字符 的 第 二 个 字 
节 是 否 回避 单字 节 字 符 的 表达 。 这 个 区 别 对 于 程序 员 来 讲 是 个 很 大 的 问 
题 。 这 是 因为 ， 在 Shift_JIS 编码 中 ， 双 字 节 字符 的 第 二 个 字 节 有 可 能 是 
程序 中 有 特殊 意义 的 字符 。 

比如 ， 下 7 了 7 了 YF 了 下 (上 史 来 咪 发 有 唆 拉 西 哆 ) 中 的 ( 唆 )、 
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表示 中 的 表 、 申 这 如 中 的 申 的 第 二 个 字 市 和 反 斜 杠 (\ ) 是 同一 个 
字 节 “。 正 因为 如 此 , 将 这 些 字 符 使 用 在 源 代码 中 将 不 会 得 到 期 望 的 
输出 。 

人 


( 
LE (ne 
ee a 


人 
A 
侮 7 

垂 才 认 吉 


或 者 将 这 些 字 符 使 用 在 字符 串 的 最 后 时 会 导致 错误 发 生 。 


IE 


错误 输出 

Can't find string terminator '"' anywhere before EOF at sjis2.pl line 1. 
以 上 两 个 例子 是 在 Perl 程序 中 进行 说 明 的 。 这 些 是 在 Windows 中 

编写 Perl 程序 时 经 常 遇见 的 问题 。 但 这 一 现象 不 是 Perl 程序 中 特有 的 。 

比如 下 面 的 C++ 程序 ， 注 释 符 后 一 行 代码 无 法 执行 。 这 是 因为 ， 注 释 的 

最 后 一 个 字符 “能 ” 字 的 第 二 个 字 节 和 有 反 斜 杜 相同 ， 因 为 有 这 个 反 斜 

杠 ， 换 行 符 就 略 过 了 ， 于 是 把 后 一 行 也 包含 在 注释 的 内 容 里 面 了 。 


人 于 


上 WeUGE 和 二 SEE 


em 
BarimeEF (ri\an); 
// 不 好 的 注释 ， 某 某 功能 
Barimers (nr2\nan); 
Barimes (rsS\an); 


QD 此 外 ,关于 这 个 问题 还 可 能 发 生 在 哪些 字符 上 ,请 参照 维基 百科 中 Shift JIS 的 “第 
二 字 节 可 能 是 SC 等 时 的 问题 ”部 分 。http://ja.wikipedia.org/wiki/Shift JIS。 
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输出 :注意 2 没有 输出 来 


要 解决 这 个 问题 ， 有 人 认为 可 以 在 不 能 正常 显示 的 字符 后 面 补 上 反 
斜 杠 的 方法 。 也 有 人 提议 不 要 使 用 Shift JIS， 使 用 EUC-JP 或 者 UTF-8 
就 行 了 。 然 而 ， 这 个 问题 原本 是 因为 语言 处 理 需 不 知道 源 代码 是 用 何 种 
编码 方式 编码 而 引起 的 。 它 不 知道 源 代 码 是 用 Shift_JIS 编码 编写 的 ， 因 
此 误 把 日 语 字符 的 第 二 个 字 节 当 作 了 ASCII 码 中 的 反 斜 杠 。 


I 魔术 注释 符 


为 了 能 让 语言 处 理 融 正确 地 处 理 包含 多 字 节 字符 的 源 代 码 ， 就 需要 
告诉 它 源 代码 的 编码 方式 。 其 中 一 个 方法 就 是 使 用 魔术 注释 符 。 魔 术 注 
释 符 最 早 是 编辑 器 的 一 个 功能 。 在 Emacs 和 Vim 等 文本 编辑 器 中 ， 用 
特殊 的 记号 事先 写 明 文件 的 编码 方式 ， 编 辑 带 要 打开 这 一 文件 时 就 会 以 
这 一 编码 方式 读 取 文件 。 

ED 


eenmgasnmEes + 


Vim 
pvim ec rilecencodingaanitt ie 

语言 处 理 硕 如 果 按 这 种 方式 去 谈 ， 就 能 知道 源 代 码 中 字符 的 编码 
了 ， 这 样 一 来 问题 就 可 以 得 到 解决 了 。 这 一 提案 在 2001 年 作为 Python 
语言 的 扩展 方案 被 公布 出 来 ”"。 现 在 Ruby 语言 .Perl 语言 和 Scheme 语言 
的 处 理 需 Gauche 等 都 采用 了 这 一 方案 。 

Python 语言 进一步 采取 了 更 为 激进 的 设计 方法 。 源 代码 中 只 要 是 使 
用 了 ASCII 码 以 外 的 字符 ， 但 没有 使 用 魔术 注释 符 时 ， 都 将 导致 语法 错 
误 。 比 如 ， 源 代码 中 用 日 语 写 了 注释 ， 就 会 带 来 以 下 错误 。 


(DD PEP 0263— Defining Python Source Code Encodings, http://www.python.org/dev/peps/ 
pep-0203. 
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Python 语 言 中 的 错误 消息 


SyntaxError: Non-ASCII character '\xe6' in file tmp.py on line 1, but no 


encoding declared; see http://ww.python.org/peps/pep-0263.html for 
details 


这 有 段 错误 消息 表示 在 文件 中 发 现 了 非 ASCII 码 的 字符 ， 但 没有 声明 
编码 方式 。 

正 因 为 此 种 设计 ， 我 们 在 编写 程序 时 ， 要 注意 不 要 忘记 向 语言 处 理 
佑 声 明 编 码 方式 ， 否 则 会 出 现 一 些 问题 。 与 此 同时 ， 也 有 用 户 对 Python 
语言 就 因为 仪 有 少量 日 语 注释 而 可 能 导致 错 误 这 一 特点 表示 不 满 。 这 的 
确 是 一 个 令 人 头痛 的 问题 。 


‖ Unicode 带 来 了 统一 


至 此 ， 我 们 学 习 了 表现 日 语 字 符 的 三 种 主要 编码 方式 、 它 们 之 间 的 
差异 以 及 由 此 带 来 的 问题 。 

这 里 我 们 再 来 回顾 一 下 字符 集 和 编码 方式 的 历史 。 我 们 说 过 在 日 本 
国内 曾经 有 多 种 字符 的 编码 方式 ， 听 起 来 有 些 麻烦 。 然 而 把 目光 投向 全 
球 ， 这 个 问题 就 变 得 更 加 严重 了 。 各 语言 表达 各 自 的 字符 时 都 具有 自己 
独特 的 字符 集 。 编 码 方式 必然 也 因 国 家 不 同 而 各 不 相同 。 

随 着 互联 网 的 发 展 ， 各 国 间 的 数据 交互 越 来 越 频繁 ， 这 个 问题 也 越 
来 越 突显 。 处 理 希 伯 莱 语 要 用 ISO-8859.8 的 编码 方式 ， 处 理 俄语 要 用 
KOI8， 处 理 中 文 繁体 字 要 用 BIG5, 诸如 此 类 ， 各国 的 规则 必须 要 一 一 
记 住 。 那 有 没有 更 简便 的 方法 呢 ? 

于 是 ， 我 们 开始 了 尝试 设计 一 种 能 编码 世界 上 所 有 字符 的 编码 方 
式 。1984 年 国际 标准 化 组 织 (ISO ) 开始 了 Universal Character Set 
( UCS ) 的 标准 化 作业 。 另 外 ,美国 施乐 公司 ( Xerox ) ”于 1987 年 左右 
开始 进行 同样 的 尝试 ， 并 于 1989 年 公布 了 初稿 Unicode Draft 1。 最 
终 ，ISO 制定 的 规则 被 否决 ， 与 Unicode 融合 之 后 于 1993 年 成 为 国际 


(DD 施乐 公司 主要 生产 激光 打印 机 ， 于 1970 年 成 立 了 帕 罗 奥 多 研究 中 心 (Palo Alto )， 
对 计算 机 发 展 起 到 了 举足轻重 的 作用 。 图 形 用 户 接 口 ( 鼠 标 和 画面 上 的 按钮 等 ) 
和 以 太 网 (Ethernet, 在 LAN 中 最 为 广泛 使 用 的 规格 ) 都 是 在 这 个 研究 中 心 诞 生 的 。 
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9.4 什么 是 字符 | 149 
标准 。 
就 这 样 ， 一 个 包含 世界 上 所 有 字符 的 字符 集合 
(图 9.17) 2 


1 图 9.17 涵盖 各 国字 符 的 统一 字符 集 


Unicode 诞生 了 


字符 编码 方式 符号 


字符 集 
| 1s08850 ep A N:EO、 N:E7 


也 许 有 读者 听 说 过 日 语 字符 串 编 码 方式 UTF-8。 它 就 是 一 种 用 来 编 
码 Unicode 这 样 统一 之 后 的 字符 集 的 编码 方式 ”。 


在 本 节 的 开始 我 们 问 了 这 样 一 个 问题 ， 信 是 字符 吗 , J 是 字符 吗 ， 
又 是 字符 吗 ? 

答案 是 肯定 的 。 对 于 这 些 问题 ， 谁 都 可 以 随意 去 决定 。 但 是 ， 在 这 
种 状态 下 ， 使 用 时 会 带 来 诸多 不 便 。 于 是 大 家 商议 出 了 统一 的 规则 ， 这 


uu 


(DD Unicode 是 在 施乐 公司 初稿 的 基础 上 ， 由 相关 计算 机 企业 联名 组 成 的 非 营利 机 构 
Unicode 联盟 统一 制定 的 。 

@) 严格 来 讲 ，Unicode 和 ISO 制定 的 规格 ISO/IEC 10646 ( UCS: Universal Coded 
Character Set ) 不 是 同一 种 规格 。 其 区 别 本 书 不 做 论述 ， 这 里 不 区 别 UCS 和 
Unicode， 只 进行 简单 说 明 。 

(3) 字符 集 得 到 了 统一 ， 但 为 适应 不 同 的 需求 ， 字 符 的 编码 方式 还 有 很 多 种 ， 如 
UTF-7 和 UTF-16 就 是 其 中 两 种 。 
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就 是 Unicode。 在 Unicode 中 ， 这 三 种 都 规定 为 算是 字符 。 


2) 
什么 是 字符 串 


字符 串 就 是 字符 并 列 的 结果 ， 但 在 不 同 的 语言 中 ， 字 符 串 列 的 表现 
方式 各 不 相同 。 

本 节 我 们 来 看 一 下 C、Pascal、Java、Ruby 和 Python 这 几 种 话 言 中 
的 字符 串 。 这 五 种 语言 中 ， 只 有 C 语言 中 的 字符 串 不 知道 自身 的 长 度 。 
其 他 声言 中 的 字符 串 都 携 刘 有 表现 自身 长 度 的 整数 。 可 以 说 C 语言 中 的 
字符 串 是 最 为 原始 的 字符 串 。 


下 长 度 信息 的 Pascal 语言 字符 串 和 不 带 这 一 信息 的 C 语 言 字符 下 

C 语言 和 Pascal 语言 都 规定 1 个 字符 为 8 个 比特 ”。 同时 Pascal 语言 
采用 了 在 字符 串 开 头 放 置 字 符 串 长 度 的 规则 。 而 C 语言 中 的 字符 串 只 是 
拥有 字符 串 开 始 后 的 内 存 空间 。 它 不 携 市 长 度 的 信息 ， 因 此 不 知道 从 开 
始 到 何 处 为 止 是 这 个 字符 串 ( 图 9.18 )。 


1 图 9.18 C 语言 字符 串 和 Pascal 语言 字符 串 


Pascal 语言 字符 串 


那么 C 语言 字 符 串 是 如 何 表现 字符 串 本 吴 到 何 处 为 止 呢 ? 


由 实际 上 ,因为 C 语 言 中 只 是 规定 了 char 类 型 为 最 低 8 比 特 的 类 型 ,IBM7.01( 1952 年 ) 
和 UNIVAC 1103 (1953 年 ) 中 采用 了 9 比特 。 但 是 时 至 21 世纪 的 今天 ，8 比特 
的 机 器 占 了 绝 大 多 数 ， 这 里 简单 化 处 理 了 。 另 外 ，char 是 character ( 字符 ) 的 前 
四 个 守土 
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目 用 NUL 字符 表示 字符 串 的 终止 
为 达到 这 一 目的 使 用 了 一 种 表现 字符 串 终 止 的 特殊 字符 ， 这 就 NUL 
字符 ”。NUL 字符 是 一 个 与 0 对 应 的 字符 ,在 C 语言 代码 中 用 \0 表示 。 
我 们 来 试 一 下 这 段 代 码 。 在 命名 为 str 的 变量 中 放 入 一 个 在 abc 和 
def 中 夹 厦 NUL 字符 的 字符 串 。 青 把 str 变量 放 到 printf 输出 ， 并 且 转 递 
给 返回 字符 串 长 度 的 函数 strlen。 这 上段 代码 的 执行 结果 如 何 呢 ? 


#include <stdio.h> 


einaenlel sn 


EN 


char SErF|[100] = "ade\0deEr:; 
ee a 

DelaeE ("SZu\n", SCElem(aes))s 
ECU OF 


结果 如 下 所 示 ， 返 回 只 有 abc， 字 符 串 的 长 度 为 3. 


abc 


3 


尽管 声明 了 str[100]，NUL 字符 后 面 还 有 def， 但 这 些 都 无 影响 输出 
结果 。 归 根 结 底 ，C 语言 字符 串 是 把 “从 头 开 始 读 取 ， 直 到 第 一 个 NUL 
字符 出 现 ” 的 位 置 当 作 一 个 字符 串 处 理 。 
目 NUL 字符 导致 的 不 便 

C 语言 字符 串 是 非常 原始 的 ， 因 此 很 容易 发 生 一 些 奇怪 的 事情 。 执 
行 下 面 的 代码 得 到 的 结果 是 defabc$$， 字 符 串 的 长 度 是 8。 这 是 怎么 造 
成 的 呢 ”? 


QD ASCII 规定 将 null character 简称 为 NUL， 换 行 (line feed ) 简称 为 LF。 为 了 避免 
与 C 语言 中 的 NULL 指针 相 混 消 ， 本 书 中 用 NUL 字符 来 表述 。 

@ 这 段 代 码 在 Mac OS X 10.7.5 上 的 gcc 4.2.1 中 确认 过 ， 但 很 可 能 因 操 作 系统 、 编 
译 器 版 本 或 选项 的 不 同 ， 执 行 结果 也 有 所 不 同 。 
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#include <stdio.h> 


nel el ee a 


Te | 
lm 区 三 2528 
CGInaE sn el leu 
Gen silent 
Brinef (Se\n", Str2); 
DrineE ("Szu\n", Strlen(sStr2)); 
EGU O08 


} 


defabcss 
8 


原因 是 str 和 str2 都 声明 为 char[3]， 只 分 配 了 3 字 节 的 空间 。abc 这 
一 3 个 字符 的 字符 串 要 表达 它 在 字符 c 的 地 方 结束 的 话 ， 需 要 3 个 字符 
再 加 NUL 字符 总 共 4 个 字符 的 空间 ， 但 是 代码 中 只 为 其 分 配 了 3 个 字 
节 的 空间 。 因 此 ，abc 后 面 的 NUL 字符 以 及 def 后 面 的 g 和 NUL 字符 
都 没 能 放 入 而 被 舍弃 了 。 故 而 在 显示 str2 时 ， 首 先 显示 def， 然 后 是 显 
示 与 之 相 邻 的 空间 里 保存 的 abc。 

那么 最 后 的 $$ 又 是 怎么 回 事 呢 ? 这 其 实 是 函数 开始 部 分 的 int x = 
9252; 语句 在 内 存 中 写 和 的 整数 9252. 9252 用 16 进 制 表 示 就 是 2424 ， 
在 ASCI 码 中 24 是 $。 因 此 这 个 整数 和 被 解释 为 有 两 个 $ 并 列 的 字符 串 
的 一 部 分 。 与 之 相 邻 的 内 存 中 是 00， 被 当 作 是 NUL 字符 ， 显 示 到 此 终 
止 (图 9%.19 )。 然 而 ， 在 某 些 情况 下 可 能 显示 出 更 多 的 内 容 ， 并 且 有 可 
能 会 试图 读 取 那些 禁止 读 取 的 内 容 ， 从 而 造成 程序 的 异常 终止 。 


1 图 9.19 ”运行 时 的 内 存 状况 


str2: char[l3] str: charl3] 


d e f 避 b C 整数 9252 \0 
e465 | 60|6r |62| 6 za | 00 
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| 1 个 字符 为 16 比特 的 Java 语言 字符 捉 


至 此 ， 我 们 学 习 了 携带 有 长 度 信息 的 Pascal 语言 字符 串 和 不 带 有 这 
一 信息 的 C 语言 的 字符 串 。C 语言 风格 的 字符 串 处 理 起 来 还 是 比较 困难 
的 。 实 际 上 ， 大 多 数 语 言 都 采用 了 Pascal 语言 风格 的 字符 串 。 

Java 语言 字符 串 也 是 携 融 有 长 度 信息 的 字符 串 。 然 而 Java 语言 的 最 
大 区 别 在 于 它 规定 Char 类 型 是 16 比特 ”。C 语言 或 是 Pascal 语言 对 字符 
为 何 物 的 定义 都 不 一 样 。C 语言 中 字符 被 定义 为 是 一 个 8 比特 、0~255 
范围 内 可 以 表现 的 ASCII 字符 或 者 EBCDIC 字符 ， 而 Java 语言 中 学 符 
被 定义 为 是 一 个 16bit、0~65535 范围 内 可 表现 的 Unicode 字符 。 


| Python 3 中 引入 的 设计 变 


Python 语言 既 支持 Java 语言 的 16 比特 的 Unicode 字符 串 ， 也 支持 
Pascal 语言 那样 的 8 比特 的 字 节 串 列 的 字符 串 “。 

在 Python 2.x 版 本 中 ， 源 代码 中 有 " 喜 " 时 ， 这 是 一 个 字 节 串 列 的 
字符 串 。 如 果 源 代码 的 编码 方式 为 UTF-8， 这 就 变 成 一 个 有 ['0xe3，, 
'0x81', '0x82'] 三 个 学 市 的 串 列 。 写 成 u" 加" 时， 表示 这 是 一 个 Unicode 
的 字符 串 ， 只 有 一 个 Unicode 字符 即 ['0x30421]. 

因为 同时 存在 两 种 类 型 的 字符 串 ， 于 是 会 有 一 个 问题 ， 两 者 混合 使 
用 的 话 会 怎样 ? Python 2.x 版 本 规定 ， 在 ASCII 人 码 环 境 下 时 字 市 串 列 被 
当 作 ASCII 人 码 并 且 可 以 目 动 转换 成 Unicode。 


Python 2.7 


>>> u'"hello, " + "Alice" 


u'hello, Alice'! 
>>> u"hello, ™ + "大 朗 " 


naam ee 


QD 那么 16 比特 无 法 表达 的 字符 怎么 办 ?这 时 可 以 使 用 通过 两 个 16bit 的 值 组 合 来 表 
达 1 个 字符 的 方法 一 一 代理 对 。 它 使 用 了 16bit 中 没有 用 于 字符 表达 的 空间 。 这 
一 原理 和 EUC-JP 中 通过 组 合 8bit 中 没有 用 于 表达 字符 的 空间 来 表达 8bit 所 不 能 
表达 的 字符 的 原理 是 相似 的 。 

@) 严格 来 讲 ，Unicode 是 16bit 还 是 32bit 是 在 编译 时 通过 选项 来 指定 的 。 
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Bem les 
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: 


Pe Et Eh 

※ Python 2.7 中 字 节 串 列 只 在 ASCII 码 时 才能 和 Unicode 字符 串 结合 

然而 ， 在 字符 串 内 容 不 同时 ， 这 一 规定 有 时 正常 有 时 却 会 导致 销 
误 。 在 只 使 用 了 ASCII 字 符 的 测试 案例 中 可 以 正常 运行 ， 而 在 使 用 了 
ASCI 字符 以 外 的 字符 的 日 本 却 会 有 问题 。 

因此 ，Python 3.x 版 本 舍弃 了 Python 2.x 版 本 中 的 兼容 性 ， 赎 绕 字 
符 串 展开 了 大 的 变革 。 首 先 ， 规 则 发 生 了 变化 。 写 成 " 为 "时 直接 是 
Unicode 字符 ， 写 成 "b" 时 是 学 市 串 列 ， 这 样 Unicode 字符 串 台 很 容易 书 
号 了 。" 办 "就 变 成 和 在 Java 语言 中 一 样 的 了 。 

其 次 ,在 Unicode 字符 串 和 字 节 串 列 结合 的 时 候 ， 不 管 其 想 结 合 的 
内 容 如 何 ， 都 将 抛 出 类 型 错误 。 在 有 需要 混合 字符 串 时 ， 规 定 有 必要 显 
示 地 使 用 转换 代码 ， 这 避免 了 在 不 知情 的 情况 下 进行 了 转换 而 导致 问题 
发 生 的 被 动 局 面 。 


>s>> "hello, ™ + br"Alicen" 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
meee envenr Ee ees os me 
Sree ee eae AS 
'hello, Alice' 
※ Python 3.0 中 将 字 节 囊 列 结合 到 Unicode 字符 串 时 常常 发 生 错误 。 这 时 需要 显示 地 将 字 节 事 列 
转换 成 Unicode 字符 串 。 


※ 在 转换 成 Unicode 字符 串 时 为 什么 要 写 ASCII 呢 ? 也 许 有 人 这 样 问 。 这 里 的 decode("ASCII 是 
指 将 使 用 ASCII 编码 方式 编码 了 (encode ) 的 内 容 做 还 原 处 理 (decode )。 


| Ruby 1.9 的 挑战 


Python、Java 等 众多 语言 都 采用 了 以 Unicode 为 基础 的 字符 串 ， 而 
Ruby 语言 却 走出 了 独树一帜 的 路 线 。 从 Ruby 1.9 开始 ， 字 符 串 就 是 8 


(DD 这 是 我 们 在 第 6 章 中 学 习 的 “错误 优先 ”的 一 个 表现 。 
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个 比特 ,并 且 采 用 了 追加 编码 方式 信息 的 设计 方法 ”。 这 种 方法 的 优点 是 
可 以 直接 书写 那些 不 包含 在 Unicode 字符 集中 的 字符 。 比 如 ， 在 提供 面 
器 移动 电话 使 用 的 互联 网 服务 时 ， 有 需要 保证 各 移动 电话 厂商 设置 的 表 
情 符 号 之 间 的 兼容 性 。 

在 这 个 表情 符号 的 问题 上 ， 合 歌 公 司 和 羡 果 公司 采取 了 不 同 的 战 
略 。 它 们 在 Unicode 联盟 上 提议 将 移动 电话 上 使 用 的 表情 符号 也 添加 到 
Unicode 字符 集中 来 。 于 2010 年 发 布 的 Unicode 6.0 中 退 加 了 数 百 个 字 
符 的 表情 符号 。 亦 即 ， 从 Unicode 6.0 开始 ， 诸 如 “握手 表情 ”这 样 的 
都 变 成 字符 了 “。 


9.6 
小 结 


本 章 我 们 学 习 了 一 种 能 往 其 中 放 和 多 个 元 素 的 东西 一 一 容器 。 并 且 
了 解 到 因为 在 内 存 上 存储 数据 的 方式 不 一 样 ， 各 种 容 需 的 性 能 也 不 同 ， 
没有 一 种 容器 在 各 方面 都 是 最 优 的 ， 而 是 优 缺 点 兼 具 。 多 数 语言 都 文 持 
数组 和 链表 两 种 容 需 。 

另外， 我 们 还 学 习 了 字符 串 和 值 的 对 应 方式 。 它 也 会 因为 实现 方式 
不 同 而 具有 各 种 优 缺 点 。 多 数 语 言 都 支持 散 列 表 。 

在 本 章 后 半 部 分 我 们 一 起 探讨 了 一 种 可 以 放 入 任意 多 字符 的 东 
西 一 一 字符 串 。 字 符 串 也 有 很 多 种 类 。 首 先是 何 为 字符 的 问题 (字符 集 
的 差异 )， 其 次 是 如 何 用 比特 列 来 表示 字符 的 问题 (字符 编码 方式 的 差 
异 )， 再 次 是 如 何 有 人 针 对 性 能 在 内 存 中 存储 信息 的 问题 (字符 串 的 实现 
的 差异 )。 多 数 语言 都 支持 字符 串 ， 但 方式 绝对 不 是 一 样 的 。 


JJ 《Rubyist Magazine - Ruby M17N 0 设计 上 罕 装 》( 中 文 译名 : Rubyist Magazine - 
Ruby M17N 的 设计 与 实现 )http://jp.rubyist.net/magazine/?0025-Ruby19 ml7n。 

@) 谷歌 公司 作为 最 大 的 检索 引擎 供应 商 ， 其 提供 的 网 络 邮箱 服务 Gmail 在 2013 年 有 
同时 超过 4 亿 人 的 活跃 用 户 。 为 了 使 得 包含 表情 符号 的 邮件 也 能 在 其 他 终端 正确 
显示 ， 把 表情 符号 添加 到 Unicode 中 去 确实 带 来 了 很 大 的 便利 。 顺 便 说 一 句 ， 表 
示 握 手 的 编码 是 1F359。 
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最 后 ， 我 们 讨论 了 试图 在 实现 方式 上 解决 这 些 差异 性 的 问题 的 方 
案 ， 如 Python 语言 和 Ruby 语言 中 的 实现 方案 。 同 时 我 们 了 解 了 试图 在 
标准 制定 上 解决 这 些 问 题 的 方案 ， 如 来 目 谷 歌 公 司 和 竺 末 公 司 的 提议 。 
作为 一 名 程序 设计 者 ， 笔 者 倾 问 于 给 在 实现 方式 上 解决 问题 的 方案 给 予 
更 高 的 评价 ， 但 我 也 次 知 ， 这 个 地 球 不 是 单 徘 程 序 员 运 转 的 ， 现 实 中 还 
有 很 多 不 依赖 于 程序 实现 方式 的 解决 方案 。 
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本 章 我 们 学 习 同 时 进行 多 个 处 理 时 可 能 产生 的 问题 及 其 规避 策略 。 


10.17 


什么 是 并 行 处 理 


本 章 我 们 来 学 习 并 行 处 理 。 

现在 我 们 使 用 个 人 计算 机 时 ， 可 以 一 边 听 音乐 ， 一 边 用 文字 处 理 软 
件 写 文章， 还 可 以 上 网 浏览 信息 。 像 这 样 ， 在 重 登 的 时 间 段 内 同时 进行 
的 多 个 处 理 叫 做 并 行 处 理 。 

在 EDSAC 等 古老 的 计算 机 上 ， 从 导入 程序 、 计 算 开 始 直 到 计算 结 
束 的 整个 过 程 中 ， 除 了 等 待 不 能 做 其 他 任何 事情 。 一 个 程序 从 开始 执行 
到 其 结束 的 期 间 内 ， 计 算 机 只 能 处 理 这 一 项 任务 。 

为 了 实现 便利 的 并 行 处 理 ， 出 现 了 进程 和 线程 的 概念 。 男 外 ， 由 于 
并 行 处 理 产 生 了 一 些 新 的 问题 ， 为 应 对 这 些 问题 又 发 明了 锁 和 光纤 等 概 
念 。 本 章 我 们 来 学 习 这 些 内 容 “。 


TU 
细 分 后 再 执行 


比 起 同一 时 刻 只 能 进行 一 种 处 理 ， 同 时 进行 多 项 处 理 显然 更 加 便 
利 。 然 而 执行 处 理 用 的 线路 ( CPU ) 只 有 一个， 怎样 才能 做 到 同时 执行 


(DD 有 读者 经 常 问 起 并 行 和 并 列 的 差别 ,这 里 做 个 说 明 。《 程 序 设计 语言 :概念 和 结构 》 
一 书 提 到 : 程序 设计 语言 中 的 并 行 性 和 硬件 中 的 并 列 性 是 相互 独立 的 两 个 概念 。 
并 列 性 是 硬件 层面 的 表述 ， 比 如 英特尔 公司 于 1999 年 发 布 的 Pentium II 中 的 可 
以 同时 针对 四 个 值 进行 运算 的 SSE 命令 ， 以 及 NVIDIA 为 了 记录 因为 GPU 带 来 
的 高 并 列 性 的 处 理 于 2007 年 发 布 的 CUDA 等 。 而 本 章 将 要 讨论 的 是 程序 设计 语 
言 领域 的 并 行 性 ， 具 体 来 说 是 进程 和 线程 的 概念 。 
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多 项 处 理 呢 ”答案 就 是 在 人 们 察觉 不 到 的 极 短 间 隔 内 交替 进行 多 项 处 
理 。 尺 管 在 某 一 瞬间 实际 只 进行 一 项 处 理 , 但 人 们 会 觉得 似乎 有 多 项 处 
理 在 同时 进行 。 

这 是 并 行 处 理 中 最 为 重要 的 概念 。 在 人 们 看 来 ,程序 是 一 刻 不 停 地 
在 执行 ， 但 实际 上 它 被 细 分 成 了 小 段 来 执行 。 


10.3 
交替 的 两 种 方法 
使 用 一 个 处 理 线路 执行 多 项 处 理 ， 就 像 两 兄弟 一 起 玩 一 台 单 人 游戏 


机 一 样 。 如 果 能 在 彼此 部 同意 的 时 间 间 隔 内 轮流 玩 ， 那 么 也 就 相当 于 两 
人 各 目 在 玩 一 人 台 单 人 游戏 机 。 “和 何 时 交 蔡 ”可 以 分 为 两 种 情况 。 


i 协作 式 多 任务 模式 一 一 在 合适 的 节点 交替 


一 种 方法 是 在 合适 的 节点 自发 进行 交 蔡 。 利 用 这 种 方法 实现 的 多 任 
务 ( 并 行 处 理 ) 称 为 协作 式 多 任务 模式 。 

这 种 方法 有 一 个 问题 ， 有 可 能 某 个 处 理 一 直 找 不 到 合适 的 节点 进行 
任务 切换 从 而 持续 地 进行 ， 导 人 致 其 他 处 理 无 法 等 到 执行 的 机 会 。 归 根 结 
底 ， 采 取 这 种 方法 是 基于 一 种 信任 ， 即 所 有 的 处 理 都 会 在 适当 的 间隔 后 
进行 交 蔡 。 

再 看 一 下 那个 游戏 机 的 比喻 ， 如 果 哥 哥 一 直 玩 下 去 不 给 第 第 玩 的 
话 ， 了 轨 弟 无 论 等 多 久 都 玩 不 上 了 。 这 时 和 划 弟 估计 会 回 妈 妈 告 状 ， 哥 哥 会 
被 责怪 吧 。 

Windows 3.1 和 Mac OS 9 都 是 协作 式 多 任务 系统 。 即 使 不 是 有 意 为 
之 ， 有 时 也 会 遇 到 程序 缺陷 进入 无 限 循 环 ， 竺 并行 处 理 的 程序 完全 没有 
交 符 ， 全 部 程序 都 变 得 没有 啊 应 了 。 


QD 目前 ,在 PC 机 的 CPU 上 装载 多 个 处 理 线 路 已 经 成 为 了 主流 ， 这 称 为 多 核 。 此 处 
为 了 简化 只 讨论 单 核 的 情况 。 
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| 抢占 式 多 任务 模式 一 一 一 定时 间 后 进行 交替 


“ 何 时 交 蔡 ”这 个 问题 的 为 一 种 解决 方法 是 阳 一 定时 间 就 进行 交 蔡 。 
这 个 方法 中 ， 有 一 个 比 其 他 程序 都 具有 优势 的 程序 叫 任务 管理 右 。 它 在 
一 定时 间 后 强制 中 断 现在 正在 进行 的 处 理 ， 以 便 人 允许 其 他 程序 执行 。 

还 是 再 来 看 一 下 那个 游戏 机 的 类 比 ， 这 好 比 妈妈 每 隔 十 五 分 钟 命令 
换 人 玩 。 换 成 计算 机 ， 它 能 在 人 们 察觉 不 到 中 断 发 生 的 间隔 时 间 〈 比如 
20 毫秒 或 0.02 秒 ) 实现 交替 。 

利用 这 种 方法 实现 的 多 任务 称 为 抢占 式 多 任务 模式 。 所 谓 抢占 就 是 
指 能 够 终止 其 他 人 的 行为 ， 这 种 方式 和 协作 式 多 任务 模式 不 同 ， 它 的 显 
著 特 征 在 于 ， 不 需要 被 终止 程序 的 协助 就 可 以 单方 面 强制 终止 它 ”。 

Windows 95、Mac OS 以 后 的 版 本 以 及 Unix、Linux 等 操作 系统 都 
是 使 用 这 种 方法 实现 的 多 个 程序 的 并 行 处 理 。 


10.4 
如 何 避 免 竞 态 条 件 


对 程序 使 用 者 来 说 ， 抢 占 式 多 任务 模式 十 分 方便 ,但 对 于 程序 设计 
者 来 讲 会 出 现 其 他 问题 。 在 不 知道 何 时 被 喝 令 终止 并 交 蕉 的 前 提 下 ， 要 
编写 一 个 能 稳妥 执行 的 程序 是 非常 困难 的 。 

我 们 来 看 下 面 这 段 反 映 银行 交易 的 伪 代 码 ， 看 看 有 可 能 发 生 哪些 


问题 。 


如 果 存 款 余额 高 于 10 000 元 { 
存款 余额 减 去 10 000 元 、 
Hx To 000 7 


单 看 这 段 程序 似乎 没有 任何 问题 。 问 题 会 发 生 在 当 存款 余额 这 个 变 


(D preemptive 和 preemption 是 军事 和 法 律 用 语 ， 字 典 中 的 解释 比较 难 懂 。 牛 津 高 阶 
英语 词典 中 的 解释 是 done to stop somebody taking action 。 
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量 被 共有 ， 并 且 这 个 程序 在 多 处 同时 执行 时 。 在 检查 了 “如 果 存 款 余 额 
高 于 10 000 元 ”之 后 ， 有 可 能 不 凑巧 刚好 又 交替 到 别 的 程序 的 执行 上 。 
这 时 会 出 现 以 下 情况 ， 存款 余额 只 有 15 000 元 时 却 取 出 来 20 000 元 钞 
票 的 严重 问题 。 


( 假设 存款 余额 有 15 000 元 。 首 先 程 序 A 执 行 ) 
A: 存款 余额 高 于 10 000 元 吗 ? 一 Yes 
( 这 里 又 交替 到 程序 B 的 执行 上 ) 
BT 0007TIU > Yes 
B: 存款 余额 减 去 10 000 元 、 取 出 10 000 元 的 钞票 
( 这 里 存款 余额 变 为 5，000 元 。 然 后 再 交替 回程 序 A ) 
A: 存款 余额 减 去 10 000 元 、 取 出 10 000 元 的 钞票 
( 存款 余额 仅 有 5000 元 却 取出 了 1 万 元 | ) 


这 种 局 面 被 称 为 竞 态 条 件 (Trace condition )， 或 者 说 这 个 程序 是 非 线 


| 竞 态 条 件 成 立 的 三 个 条 件 


条 
范 态 条 件 在 什么 时 候 成 立 呢 ?并行 执行 的 两 个 处 理 之 间 出 现 苑 态 条 
件 必须 同时 满足 以 下 三 个 条 件 。 


@ 两 个 处 理 共享 变量 
© 至 少 一 个 处 理会 对 变量 进行 修改 
@ 一 个 处 理 未 完成 之 前 另 一 个 处 理 有 可 能 介入 进来 


反之 ， 只 要 三 个 条 件 中 有 一 个 不 具备 ， 就 可 以 编写 适 于 并 行 处 理 的 
安全 的 程序 ”。 

为 了 说 明 @ 和 @， 我 们 考虑 一 下 两 个 人 看 一 台电 视 的 场景 。 如 果 有 
一 方 随意 地 换 台 ， 另 一 方 就 有 可 能 抱 急 。 这 相当 于 满足 了 “和 变量 被 共 
享 ” 和 “@ 有 一 方 可 能 修改 ”的 条 件 。 如 果 另 外 买 一 台电 视 一 人 一 台 的 
话 ， 无 论 什 么 时 候 换 台 都 不 至 于 招致 男 一 方 的 抱怨 ， 因 为 没有 了 中 共 


(D 这 三 个 条 件 是 和 参考 了 Java Concurrency in Practice 一 书 (Brain Goetz，Joshua Bloch， 
Doug Lea 著 ， 中文 版 为 《Java 并 发 编程 实战 》 机 械 工业 出 版 社 2012 年 2 月 出 版 ， 
童 云 兰 译 ) 关于 修复 问题 程序 的 三 种 方法 的 表述 总 结 出 的 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


162 | 第 10 章 并 行 处 理 


译 的 情况 。 或 者 ,不 去 换 台 两 个 人 一 直 看 ， 也 不 会 引起 任何 问题 ， 因 为 
没有 TO 中 一 方 修改 的 可 能 。 


| 没有 共享 一 一 进程 和 actor 模型 


如 果 最 初 就 没有 共享 任何 数据 ， 条 件 @ 就 不 可 能 发 生 ， 也 就 没有 必 
要 在 意 竞 态 条 件 了 。 


和 在 进程 中 没有 内 存 共享 

相信 很 多 人 都 知道 UNIX 将 执行 的 程序 叫做 进程 (process )。 不 同 
的 进程 不 会 共享 内 存 ， 所 以 在 多 个 程序 之 间 不 会 在 内 存 上 出 现 竞 态 条 
件 。 只 需要 注意 与 数据 库 连 接 或 文件 读 写 时 共享 数据 的 情形 就 够 了 。 

但 是 进程 这 个 词 直译 就 是 “处 理 ”， 是 一 个 非常 通用 的 概念 。 它 在 
UNIX 诞生 以 前 就 已 经 被 使 用 。 当 时 的 进程 和 现在 UNIX 中 的 进程 不 一 
样 ， 它 有 时 会 共享 内 存 ， 有 时 会 进行 排他 控制 ， 更 像 是 现在 我 们 所 称 的 
线程 之 类 。 

1969 年 问世 的 操作 系统 Multics 中 ， 进 程 也 是 共享 内 存 的 “。 但 是 
Mnultics 项 目 加 入 了 太 多 的 功能 而 变 得 过 度 复杂 ， 因 此 后 来 大 家 又 发 起 了 
简化 运动 。 最 终 ， 在 1970 年 操作 系统 UNICS 被 设计 出 来 ， 它 就 是 后 来 
的 UNIX。 

UNIX 采用 了 一 种 机 制 ， 它 能 保证 每 个 进程 所 需要 的 内 存 空间 ， 不 
同 进 程 之 间 不 会 共享 内 存 “。 

由 没有 共享 的 方式 成 功 了 吗 

UNIX 的 机 制 是 一 个 进程 中 可 以 并 行 执行 的 处 理 只 有 一 个 。 也 就 是 
说 ， 如 采 要 想 多 个 处 理 并 行 执行 就 需要 启动 多 个 进程 。 不 同 的 进程 不 
共享 内 存 ， 即 并 行 执行 的 处 理 之 间 不 共享 内 存 。 那 么 这 种 方式 后 来 成 功 
J 人? 

没有 。 在 UNIX 发 布 大 约 10 年 后 ， 人 们 设计 出 了 “ 轻 量 级 进程 ”。 


Q) Multics 是 基于 PL/I 和 汇编 语言 编写 的 。1964 年 出 现 的 PL/I 程序 设计 语言 是 第 一 
个 引入 了 类 似 于 今天 的 线程 概念 的 编程 语言 。 
@ 想 了 解 更 多 细节 的 读者 可 以 搜索 关键 字 Virtual Address Space。 
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它 是 一 种 共享 内 存 、 具 有 UNIX 出 现 以 前 风格 的 进程 。 后 来 ， 这 个 被 称 

笔者 执笔 本 书 时 UNIX 已 走 过 了 近 40 年 。 在 这 40 年 的 时 间 里 ， 没 
有 共享 的 方式 中 始终 有 人 解决 不 了 的 问题 。 即 使 现在 使 用 线程 ， 对 于 共 至 
内 存 的 处 理 仍 然 让 人 头疼 ， 但 没 办 法 ， 还 得 继续 编写 程序 。 


和 actor 模型 

在 不 共享 内 存 的 设计 方针 下 ， 还 有 一 个 流派 
于 1973 年 ， 是 为 实现 并 行 处 理 而 出 现 的 一 种 模型 。 

它 认 为 可 以 通过 不 共享 内 存 而 是 传递 消息 的 方法 ”来 在 并 行 处 理 时 
进行 信息 交互 。 

我 们 以 行政 文员 、 资 料 和 公文 格 为 例 来 说 明 。 甲 打开 果 上 的 资料 进 
行 处 理 时 ， 如 果 乙 走 过 来 希望 甲 处 理 其 他 资料 ， 这 就 影响 了 甲 正 在 进行 
中 的 工作 ， 这 就 是 共享 内 存 的 问题 所 在 。 一 方面 ， 在 甲 的 工作 告 一 段落 
之 前 ， 即 使 乙 在 劳 边 一 下 等 候 也 是 浪费 时 间 。 这 就 是 后 面 要 讲 到 的 死 锁 
的 问题 。 如 果 不 这 样 , 乙 在 往 甲 的 公文 格 中 放 入 新 的 资料 后 马上 回去 处 
理 有 目 己 的 工作 ， 这 就 变 成 actor 模型 。 

这 种 模型 中 处 理 是 非 同 步 的 。 乙 不 知道 甲 何 时 会 处 理 完 公 文 格 中 的 
资料 。 不 管 何 时 处 理 完 ， 如 果 在 资料 中 写 明 “处 理 完毕 请 送 回 乙 处 ”等 

言 息 ， 一 旦 乙 在 自己 的 公文 格 中 看 到 了 甲 的 回复 ， 也 就 知道 了 这 些 资 料 
已 笃 外 理 完毕 。 

这 种 机 制 适 家 的 处 理 场景 中 ， 必 须 提 一 下 消息 交互 的 场景 。 如 
Twitter 和 Facebook 这 样 面 癌 大 量 用 户 的 信息 交互 服务 ， 应 该 有 很 多 适 
合 actor 模型 发 挥 作 用 的 处 理 。 这 些 处 理 在 实现 中 使 用 了 那些 采用 了 
Erlang”、Scala 等 actor 模型 的 语言 。 


actor 模型 。 它 发 布 


由 同期 于 1971 年 诞生 的 Smalltalk-71 是 一 种 通过 发 送 消息 实现 信息 交互 的 语言 。 
THE EARLY HISTORY OF SMALLIALK, http://gagne.homedns.org/~tgagne/contrib/ 
EarlyHistoryST.html。 

”Erlang 语言 在 1987 年 问世 ， 并 于 1998 年 成 为 开源 的 程序 设计 语言 。2007 年 ， 
为 Twitter 等 应 用 的 出 现 备 受 关注 ， 是 一 种 能 让 消息 发 送 和 接收 变 得 更 轻松 的 设计 


五 -全 
To 
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| 不 修改 一 一 const、val、Immutable 


有 一 种 方法 是 通过 规避 条 件 @@， 即 使 共享 内 存 ， 只 要 不 作 修 改 也 不 
会 有 任何 问题 。 

Haskell 语言 就 是 一 种 大 力 提 倡 这 种 方针 的 语言 ， 它 的 所 有 变量 都 不 
可 修改 。 

但 是 更 多 的 语言 采用 了 更 加 现实 的 折衷 策略 一 一 使 一 部 分 变更 无 法 
作 人 修改。 比如 在 C++ 语言 中 ， 使 用 const 声明 变量 时 ， 这 个 变量 就 是 无 
法 修改 的 。 册 如 在 Scala 语言 中 ， 有 var 和 val 两 种 声明 变量 的 方法 ， 
val 声明 的 变量 就 无 法 作 修 改 。 

Java 语言 经 常 使 用 到 Mark Grand 提出 的 设计 模式 ”之 一 的 Immutable 
模式 。 这 种 模式 下 ， 类 中 定义 了 private 字段 ， 同 时 定义 了 该 取 这 些 宇 段 
的 getter 方法 ， 但 不 定义 对 这 些 字 段 作 修改 的 setter 方法 。 因 为 没有 准 
备用 于 修改 的 方法 ， 所 以 实现 了 只 能 谈 取 但 不 能 改写 的 效果 。 


如 果 要 消除 竞 态 条 件 成 立 的 第 @@ 个 条 件 一 一 一 个 处 理 未 完成 之 前 另 
一 个 处 理 有 可 能 介入 进来 ， 这 时 该 如 何 做 呢 ? 在 处 理 期 间 如 何 杜绝 别 的 
作业 介入 进来 ? 


和 线程 的 协调 一 一 fibre、coroutine、green thread 
其 中 有 一 类 方法 ， 如 fibre、coroutine、green thread 处 理 介 入 的 原因 是 
抢占 式 线程 ， 那么 使 用 协调 模式 的 线程 就 可 以 解决 了 。Ruby 语言 中 的 
Fibre 类 ， 以 及 Python 语言 和 JavaScript 语言 中 的 generator 都 是 这 种 情况 ”。 
训 无 疑问 ， 由 于 是 协作 式 多 任务 模式 ， 如 果 有 某 个 线程 独占 CPU， 


(DD 想 了 解 更 多 细节 的 读者 可 以 参照 Patterns in Java: a catalog of reusable desien patterns 
illustrated wii UML ( Mark Grand 著 ) 一 书 。 译 者 注 。 

@) Ruby 语言 中 的 Fibre 是 在 1.9 版 本 中 增加 的 ， 而 JavaScript 语言 中 的 generator 是 
在 1.7 版 本 中 增加 的 。Python 语言 和 JavaScript 语言 都 在 generator 中 使 用 了 yield 
一 词 , 但 Ruby 语 言 由 于 历史 原因 将 yield 用 于 了 别 的 目的 ,所 以 具有 不 一 样 的 含义 。 
此 处 不 应 该 混 消 。 
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其 他 处 理 就 只 能 停止 。 说 到 底 ， 这 种 方法 的 前 提 是 各 个 线程 能 保证 合理 
的 执行 时 间 在 合适 的 时 候 做 出 让 步 。 


目 表示 不 便 介 入 的 标志 一 一 锁 、mutex、semaphore 

男 有 一 类 方法 ， 共 享 一 种 表示 不 便 介入 的 标志 。 比 如 做 一 种 约定 ， 如 
采 某 内 存 上 的 值 不 为 0 时 ， 这 意味 着 其 他 线程 如 末 介 入 将 市 来 肪 烦 。 那 么 
各 个 线程 在 执行 那些 介入 后 可 能 市 来 问题 的 处 理 时 ， 事 先 会 去 检查 这 块 内 
存 上 的 值 。 如 果 为 0 则 继续 执行 ， 如 果 不 为 0 则 等 待 其 变 回 0 后 再 做 处 理 。 

这 和 试 衣 间 中 的 门帘 或 单 人 浴室 包间 的 状态 牌 类 似 。 门 帘 关 闭 时 表 
示 这 时 试 衣 间 正 被 占用 ， 现 在 进去 的 话 不 方便 。 想 使 用 试 衣 间 的 人 只 能 
在 外 面 一 直 等 到 门帘 打开 为 止 。 

这 类 方法 有 多 种 称 法 ， 如 锁 、mutex 和 semaphore， 但 它们 的 核心 概 
念 和 浴室 的 状态 牌 是 一 样 的 “。 锁 这 个 名 字 很 容易 让 人 误解 为 只 要 上 了 锁 
其 他 人 就 进 不 来 了 ， 然 而 实际 上 它 只 是 一 个 表示 “使 用 中 ”的 状态 牌 。 
如 采 有 线程 不 去 检查 状态 牌 的 状态 ， 那 它 也 就 变 得 没有 意义 了 。 

这 一 机 制 是 艾 效 格 . 迪 科 斯 彻 ( Edsger Wybe Dijkstra ) 于 1965 年 
发 明 的 。1974 年 霍 尔 (Hoare) 发 明了 更 加 方便 的 改良 版 本 ， 即 
Concurrent Pascal 中 采用 的 monitor 的 概念 。1974 年 时 C 语言 已 经 问世 
3 年 了 ， 直 到 20 年 后 问世 的 Java 语言 采用 了 monitor 的 概念 ， 它 才 得 以 
广泛 使 用 。 

在 进入 之 前 先 检 查 是 否 持 有 “使 用 中 ”的 状态 牌 ， 如 果 有 则 等 符 ， 
如 果 没 有 挂 则 挂 上 “使 用 中 ”的 状态 牌 再 进入 。 要 实现 这 一 系列 约定 的 
动作 是 件 比 较 诬 烦 的 事情 。 比 如 使 用 让 语 句 时 ， 在 “做 值 的 检查 ”和 
“判断 为 0 则 改 为 1” 时 ， 有 可 能 有 其 他 处 理 介 入 进来 。 这 样 一 来 检查 就 
训 无 意义 了 。 为 了 不 让 其 他 处 理 在 中 间 介 入 进来 ， 就 有 必要 使 用 一 种 能 
将 值 的 检查 和 修改 同时 执行 的 命令 。 因 为 Java 语言 处 理 带 实现 了 这 一 功 
能 ， 所 以 Java 语言 用 户 无 需 烦恼 ， 只 要 和 直接 使 用 synchronized lock 就 可 
以 轻松 地 使 用 锁 的 功能 。 


Q) 本 书 统称 为 锁 。 
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10.5 
锁 的 问题 及 对 条 


| 锁 的 问题 
即便 是 使 用 上 变 得 如 此 人 简便 的 锁 ， 也 还 面临 一 些 难题 。 


和 陷入 死 锁 

假设 有 A 和 B 两 个 作业 ， 它们 都 能 修改 X 和 了 两 个 变量 。A 按照 
先 锁 住 X 再 锁 住 Y 的 顺序 上 锁 ，B 按照 先 锁 住 Y 再 锁 住 X 的 顺序 上 锁 ， 
在 某 些 时 间 点 有 可 能 会 产生 问题 。 比 如 在 A 锁 住 了 X 的 同时 B 又 锁 住 
了 站 ， 双 方 都 会 等 竺 对方 释 放 解 锁 。 

这 一 现象 叫做 死 锁 。 为 了 避免 这 一 问题 ， 程 序 员 就 需要 在 程序 的 整 
体 上 注意 上 锁 的 顺序 ， 不 仅 要 把 握 应 该 对 什么 上 锁 ， 还 要 把 握 好 按 什 么 
顺序 去 上 锁 。 


和 无 法 组 合 
另外 ， 锁 还 有 无 法 组 合 这 一 个 问题 。 比 如 要 从 列表 X 中 删除 第 一 个 


值 然后 追加 到 另 一 个 列表 站 中， 我 们 考虑 下 如 何 实现 这 个 处 理 (图 
10.1 )。 假 设 我 们 希望 把 整个 处 理 作为 一 个 完整 不 可 分 (原子 性 地 ) 的 过 
程 执 行 。 也 就 是 说 ， 在 将 从 XX 删除 的 值 到 写 入 YY 中 的 中 间 状 态 时 ， 其 
他 处 理 无 法 访问 列表 X 和 YY。 这 种 情况 下 该 上 什么 样 的 锁 呢 ? 


有 图 10.1 完整 不 可 分 的 处 理 


完整 不 可 分 的 处 理 
从 x 中 在 Y 中 
=====> = 


中 间 状 态 


在 线程 安全 的 程序 库 中 ， 程 序 员 无 需 担 心 锁 的 控制 方式 ， 内 部 机 制 
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可 以 保证 使 用 锁 后 删除 操作 或 写 入 操作 不 会 被 中 间 介 入 “。 但 这 个 锁 无 法 
保证 将 从 XX 删除 值 往 Y 中 写 人 时 不 会 被 中 间 介 入 。 要 防止 中 间 介 入 ， 
程序 员 必 须 用 新 的 锁 将 这 两 个 处 理 步 骤 包 括 起 来 ， 用 synchronized lock 
把 所 有 这 些 与 X 和 YY 读 写 相关 的 代码 包括 起 来 。 这 样 就 没 能 达到 让 程 
序 员 无 需 担 心 锁 的 控制 方式 的 目的 。 那 没有 其 他 好 方法 了 吗 ? 


i 借助 事务 内 存 来 解决 


有 一 种 叫做 事务 内 存 的 方法 可 以 解决 这 一 问题 ”这 种 方法 把 数据 库 
中 事务 的 理念 运用 到 内 存 上 ， 做 法 是 先 试 着 执 行 ， 如 末 失 败 则 回 退 到 最 
初 状态 重新 执行 ， 如 果 成 功 则 共享 这 一 变更 〈 图 10.2 )。 它 不 是 直接 修 
改 X 或 Y， 而 是 临时 性 地 创建 了 一 个 版 本 对 其 进行 修改 ， 将 一 个 完整 不 
可 分 的 过 程 执行 完毕 后 才 反 映 出 最 终 的 成 末 。 

如 果 这 个 也 拿 试 衣 间 来 类 比 ,情况 就 变 得 很 奇怪 了 “。 我 们 还 是 借 之 
前 的 例子 来 进一步 说 明 。 在 这 两 个 处 理 的 中 间 状 态 ， 如果 有 其 他 线程 的 
读 取 要 中 间 介 入 进来 将 会 怎样 呢 ?” 管 案 是 即使 有 别 的 处 理 要 介入 进来 ， 
也 只 是 创建 了 男 一 个 临时 的 版 本 ， 对 其 作 的 修改 不 会 反映 到 原来 的 数据 
上 ,在 其 他 的 线程 看 来 数据 的 状态 还 是 和 执行 X 删除 操作 之 前 一 样 。 这 
样 就 不 存在 任何 问题 。 


处 理 。 

© Tim Harris, et al. “Composable Memory Transactions”, 2006. http://research.microsoft. 
com/pubs/67418/2005-ppopp-composable.pdf. 

(83) 如 果 硬 要 把 它 类 比 为 试 衣 间 那个 例子 ， 这 个 故事 就 变 成 : 并 行 地 存在 进入 试 衣 间 
的 世界 和 没有 进入 试 衣 闻 的 世界 这 样 两 个 世界 ， 当 尝试 进入 试 衣 间 有 问题 时 ， 会 
折返 到 没有 进入 试 衣 间 的 世界 中 。 这 样 的 说 法 是 完全 没有 现实 意义 的 ， 当 然 这 个 
可 以 在 计算 机 世界 中 进行 仿真 。 
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有 图 10.2 ”创建 另外 的 版 本 然后 修改 ， 处 理 结束 后 反映 最 终 双 


X 没有 变化 X 没有 变化 X 
Eeesesesessssssss> = 和 = 
"器 "器 ”Ga 


站 a 
体现 变更 
AN X|2|3 | 取出 2 x| 3j 中 x [3] / 
后 人 


中 间 状 态 


假设 有 写 人 操作 在 中 间 介 入 进来 (图 10.3 )， 那 么 临时 创建 的 版 本 
就 会 被 丢弃 ， 重 新 回 退 到 最 初 状 态 开始 执行 。 这 样 一 来 ， 即 使 不 上 锁 也 
可 以 顺利 地 进行 并 行 处 理 。 要 注意 的 是 ， 当 写 人 的 频率 太 高 时 ， 回 退 重 
新 执行 的 操作 就 会 多 次 执行 到 ， 这 样 会 导致 性 能 下 降 。 


1 图 10.3 如果 遇 到 别 的 写 入 操作 介入 则 重新 执行 


x 从 生成 的 
x EoB9 另 一 个 版 本 
WW [ql 改写 
生成 另 一 个 x [GJ] x[3] SA\2X[9] A “*@ 
版 本 中 ~ 二 这 体现 Ya 
中 间 状 态 


| 事务 内 存 的 历史 


目 硬件 事务 内 存 

1986 年 ,一 家 名 为 Symbolics 的 公司 提出 基于 硬件 实现 的 事务 ”。 这 
家 公司 在 1981 年 开始 提供 在 人 硬件 中 安装 了 LISP 语言 的 商用 LISP 机 
句 一 一 LM-2. 

1986 年 也 是 名 为 MIPS R2000 的 CPU 诞生 的 一 年 。MISP 是 基于 


(D Tom Knight“An Architecture for Mostly Functional Language”, 1986. 
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RISC ( Reduced Instruction Set Computer ) 这 种 旨 在 减少 命令 个 数 简 化 线 
路 的 设计 方针 制作 出 来 的 CPU。 它 和 在 便 件 中 实现 LISP 语言 或 事务 这 
一 方针 相 导 而 行 。 个 中 原因 非常 复杂 ， 最 终 ，Symbolics 在 商业 上 也 并 
未 取得 成 功 。 


目 软件 事务 内 存 

在 10 后 的 1995 年 ， 一 篇 关于 如 何在 软件 中 实现 事务 内 存 的 论文 发 
表 了 “。 

又 一 个 10 年 之 后 ， 微 软 公 司 于 2005 年 发 表 了 一 篇 关于 使 用 
Concurrent Haskell 在 软件 中 实现 事务 内 存 的 论文 “。 

在 此 前 后 的 几 年 间 ， 很 多 编程 语言 都 实现 了 软件 事务 内 存 的 功能 。 
比如 ，2004 年 IBM 公司 开发 的 X10 和 2006 年 Sun Microsystems 公司 开 
发 的 Fortress 中 都 实现 了 这 个 功能 。2007 年 ， 基 于 Java VM 的 Clojure 
发 布 。 现 在 已 经 有 一 些 介绍 它 的 图 书 出 版 。 


| 事务 内 存 成 功 吗 


事务 内 存 这 一 技术 在 将 来 值得 期 待 吗 ?未 来 会 怎样 没 人 知道 。 微 软 
公司 于 2010 年 中 止 了 面向 .NET Framework 平台 搭载 软件 事务 内 存 的 实 
验 。 这 人 么 做 的 理由 众说 纷 颖 ， 但 是 认为 能 用 到 软件 事务 内 存 的 杀手 级 应 
用 缺失 这 样 的 悲观 意见 有 很 多 “。 

男 外 ， 据 说 后 续 的 Intel 处 理 希 将 搭载 事物 内 存 的 部 分 功能 。 如 知 实 
现 ， 届 时 对 于 人 硬件 事务 内 存 就 可 以 轻松 一 坛 了 了 。 至 于 今后 将 如 何 进 一 步 
发 展 ， 我 们 只 能 拭目以待 。 


JJ Nir Shavit Dan Touitou, "Software transactional memory", 1995. 

© Tim Harris, et al, “Composable Memory Transactions”, 2006. 
http://research.microsoft.com/pubs/67418/2005-ppopp-composable.pdf. 

(3) “A (brief) retrospect on transactional memory” , http:/www.bluebytesoftware.com/ 
blog/2010/01/03/ABriefRetrospectOnTransactional Memory.aspx. 
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10.0 
小 结 


本 章 我 们 学 习 了 并 行 处 理 这 个 重要 概念 。 并 行 处 理 是 长 入 以 来 人 们 
一 直 为 之 烦恼 的 问题 ， 至 今 也 有 很 多 人 为 之 困扰 。 回 顾 历 史 ， 我 们 会 发 
现 ， 人 们 在 共享 一 非 共享 一 共享 、 协 调 一 非 协调 一 协调 、 硬 件 一 软件 一 
便 件 这 样 两 种 对 立 观 念 中 左右 择 摆 。 不 单 看 片面 而 是 兼顾 两 面 ， 在 平衡 
中 灵活 运用 或 许 才 是 最 为 重要 的 。 
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11.1 什么 是 面向 对 象 

11.2 ， 归 集 变量 与 函数 建立 模型 的 方法 
11.3 方法 1: 模块 、 包 

11.4 方法 2: 把 函数 也 放 入 散 列 中 
11.5 万 法 3: 闭 包 

11.6 方法 4: 类 
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本 章 我 们 来 学 习 面 向 对 象 。 

面向 对 象 所 指 的 内 容 因 语言 而 异 。 

首先 我 们 将 在 SmallTalk 和 C++ 语言 的 比较 中 分 析 这 种 差异 所 在 。 
接着 我 们 追溯 历史 来 了 解 面向 对 象 是 如 何 诞生 的 。 

最 后 ， 我 们 会 逐渐 深入 挖掘 面向 对 象 的 机 制 ， 来 学 习 面 向 对 象 的 具体 


内 容 。 


44 
什么 是 面向 对 象 


| 内 涵 因 语言 而 异 的 面向 对 象 


语言 中 的 用 语 并 不 是 共通 的 ， 在 不 同 霹 言 中 ， 同 一 个 用 语 的 含义 可 
能 会 有 很 大 差别 。 本 书 已 经 多 次 强调 这 一 点 。 笔 者 认为 ， 其 中 最 为 其 者 
就 是 面 问 对 象 这 个 概念 了 ， 至 少 有 两 位 面 问 对 象 语 言 的 设计 者 把 面 癌 对 
稼 一 词 用 来 表示 两 种 完全 不 同 的 意义 。 尤 其 是 关系 到 类 型 和 继承 时 ， 两 
者 的 含义 是 完全 相反 的 。 

C++ 语言 的 设计 者 本 页 尼 : 期 特 萎 斯 特 户 普 在 其 戎 作 The Design 
and Evolution of C++ 中 说 道 :“class 是 一 种 创建 用 户 自 定义 类 型 的 功 
能 。” 另 外 ， 他 还 在 论文 ”中 指出 :“Simula 的 继承 机 制 是 解决 问题 的 关 
键 ”"”“ 面 器 对 象 程序 设计 是 使 用 了 用 户 定 义 类 型 和 继承 的 程序 设计 ”， 从 
而 对 类 和 继承 给 予 了 正面 肯定 。 


QD 中 文 版 《C++ 语言 的 设计 与 演化 》 由 科学 出 版 社 于 2012 年 出 版 ， 琢 宗 燕 译 。 

@) 1991 年 举办 的 1st European Software Festival ( 第 一 届 欧 洲 软 件 节 ) 上 公开 的 论文 
“What is Object-Oriented Programming”( 什么 是 面向 对 象 程 序 设 计 )。 在 其 网 站 
( http://www2.research.att.com/~bs/homepage.html ) 的 research and popular papers 页 
面 能 查阅 到 。 
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然而 ,，“ 面 器 对 象 ” 这 个 词 的 发 明 者 芯 伦 :所 ( Alan kay， 他 同时 也 
是 Smalltalk 语言 的 设计 者 ) 却 持 有 不 同 的 意见 。 当 问 到 面 加 对象 一 词 的 
含义 时 ， 他 解释 说 :“ 我 并 不 是 反对 类 ， 但 是 我 还 没有 见 过 不 证 我 感到 痛 
昔 的 包含 类 的 系统 ”我 并 不 喜欢 Simula 里 继承 的 做 法 ”“ 通 过 不 同 状 态 
的 对 象 互 相传 送 消息 来 通信 的 程序 设计 就 是 面向 对 象 。 由 此 可 以 看 出 ， 
他 对 类 和 继承 持 否 定 立 场 (图 11.1 )。 


和 图 11.1 关于 面向 对 象 的 相左 意见 


一 


斯 特 克 斯 特 户 普 


本 书 不 打算 纠结 “到 底 何 为 面向 对 象 ”这 一 定义 。 我 们 将 探讨 面向 
对 象 发明 的 缘由 以 及 动机 。 图 11.2 展示 了 本 章 提 及 的 各 编程 语言 大 致 的 
问 志 时 间 ， 供 读者 参考 。 


1 图 11.2 面向 对 象 语言 的 大 致 问世 时 间 及 演化 关系 


1954 
1955 ALGOL 
1964 


Simula 


Smalltalk 


T1995 


灰色 的 为 面向 对 象 语言 


(D Dr Alan Kay on the Meaning of “Object-Oriented Programming”, http:Wwww.purlLorg/ 
stefan ram/pub/doc kay oop en. 
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| 对 象 是 现实 世界 的 模型 


我 们 是 怎样 理解 世界 的 呢 ? 我 们 将 生活 中 遇见 的 事物 总 结 为 特定 的 
“ 物 ” 的 概念 ,它们 就 是 诸如 桌子 、 椅 子 、 银 行 贷 款 、 人 公式、 人、 多 项 
式 、 三 角形 、 唱 体 管 之 类 的 东西 。 我 们 的 思考 、 话 言 以 及 行动 就 是 建 
立 在 指示 、 说 明和 操作 这 些 所 谓 的 “ 物 ” 的 基础 之 上 。 我 们 在 用 计算 
机 解决 问题 的 时 候 ， 有 必要 将 现实 世界 中 的 “ 物 ” 的 模型 在 计算 机 中 
建立 起 来 。 

以 上 就 是 程序 设计 语言 ALGOL60 的 设计 者 霍 尔 在 1966 年 演讲 的 
内 容 。 “ 物 ” 的 原文 是 object (对 象 ),“ 模 型 ”的 原文 是 model ( 模 
型 ), “现实 世界 中 物 的 模型 在 计算 机 中 应 该 怎样 建立 ?怎么 才能 轻松 地 
建立 这 些 模 型 ? 经 过 多 人 研究 探讨 ， 面 向 对 象 这 个 概念 隆重 登场 了 
(图 113) 9。 

这 正 是 面 回 对 象 语 言 的 设计 者 和 希望 达到 的 目的 ! 


有 图 11.3 ”现实 世界 中 的 物 和 计算 机 处 理 模 型 


现实 世界 中 的 物 计算 机 中 处 理 的 模型 


(D C.A.R. hoare, “RECOAD HANDLING” 1966, 1.Basic Concepts http://archive. 
computerhistory.org/resources/text/Knuth Don X4100/PDF 1ndex/k-9-pdf/k-9-u2293- 
Record-Handling-Hoare.pdf “our thought, language, and actions are based on the 
designation, description, and manipulation of these objects, either individually or in 
relationship with other objects.” 

© “RECOAD HANDLING” 1.Basic Concepts “we often need to construct within the 
computer a model of that aspect of the real or conceptual world...” 

(3) 尽管 ALGOL60 本 身 并 不 是 面向 对 象 语言 ， 但 通过 阅读 其 扩展 方案 ， 我 们 可 以 了 
解 在 面向 对 象 诞生 以 前 人 们 在 做 怎样 的 思考 。 
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‖ 什么 是 类 


准备 学 习 面 回 对 象 的 朋友 可 能 最 初 碰 到 的 概念 就 是 类 吧 。 那 么 类 到 
底 是 什么 呢 ? 这 个 问题 ， 倘 知 一 般 地 去 回答 就 要 陷 和 泥沼， 也 是 一 个 危 
险 的 问题 。 因 为 在 不 同 的 编程 语言 中 它 有 不 一 样 的 含义 。 至 少 在 C++ 语 
言 里 ， 类 被 定义 为 是 “用 户 可 上 自 定义 的 类 型 "。 但 是 正如 我 们 在 第 8 章 
学 习 到 的 ，C++ 语言 是 静态 类 型 声言 ， 而 Ruby 语言 和 Python 语言 是 动 
人 态 类 型 语言 。 也 就 是 说 ， 在 Ruby 语言 和 Python 语言 中 ， 类 型 一 词 指 的 
内 容 和 在 C++ 语言 中 是 不 一 样 的 。 在 本 和 草 的 剩余 部 分 中 ， 我 们 将 会 学 习 
动态 类 型 语言 Perl 和 JavaScript 中 类 的 构造 。 

类 ， 真 有 必要 吗 ? 抱 有 这 样 的 疑问 的 人 似乎 挺 多 的 。 那 么 ， 类 是 有 
必要 的 吗 ? 大 部 分 语言 的 程序 设计 中 ， 类 并 不 是 不 可 或 缺 的 ,但 Java 语 
言 是 例外 。Java 语言 “把 类 定义 为 部 件 ， 将 其 组 闭 起 来 即 是 程序 设计 ”。 
因此 ， 在 用 Java 语言 编写 程序 时 类 是 必要 的 。 

其 他 诸如 C++、Python、Ruby 这 样 的 语言 ， 在 编写 程序 时 既 可 以 使 
用 类 也 可 以 不 使 用 类 。 那 是 使 用 类 好 呢 ， 还 是 不 使 用 也 可 以 呢 ? 

这 取决 于 要 编写 的 程序 。 如 有 果 仪 是 小 规模 的 程序 ， 没 必要 使 用 类 的 
情况 居多 。 也 有 人 认为 ， 在 多 人 分 工 协 作 编 写 的 大 型 程序 中 ， 使 用 类 来 
划分 责任 范围 比较 好 。 几 形 用 户 界 面 的 编写 中 面 加 对象 的 特性 似乎 非常 
管用 。 比 如 设计 一 个 按钮 ， 需 要 有 放置 按钮 的 座 标 和 按钮 的 宽 、 高 等 
值 ， 也 需要 有 表达 按钮 按 下 时 的 动作 的 函数 。 将 实现 按钮 所 必需 的 这 些 
要 素 统 一 到 类 中 ， 编 写 程 序 就 会 变 得 简单 起 来 。 


11.2 
归 集 变量 与 函数 建立 模型 的 方法 
程序 设计 人 员 要 归纳 并 建立 模型 。 但 归纳 的 方法 各 式 各 样 ， 语 言 不 


同 ， 选 择 也 不 尽 相 同 。 作 为 在 C++ 语言 和 Java 语言 中 选取 的 方法 ， 类 
非常 有 名 。 这 里 我 们 和 完 来 介绍 几 种 类 以 外 的 方法 。 
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第 一 个 就 是 模块 (module )。 模 块 原本 是 一 种 将 相关 联 的 函数 集中 
到 一 起 的 功能 。 在 Perl 语言 中 类 似 的 功能 被 称 为 包 ( package )。Perl 语 
言 在 引入 面 回 对 象 时 ， 采 用 了 把 用 来 归 集 函数 的 包 和 用 来 归 集 变量 的 散 
列 ( hash ) 绑 定 在 一 起 的 方法 。 

第 二 个 方法 是 把 函数 和 变量 放 入 散 列 中 。 这 是 JavaScript 等 语言 采 
用 的 方法 。 

第 三 个 是 闭 包 (closure )。 我 们 会 讲解 这 种 使 用 因数 执行 时 的 命名 
空间 来 归 集 变量 的 方法 。 这 种 方法 主要 在 六 数 式 语言 中 使 用 。 

之 后 ， 我 们 就 类 展开 探讨 。 


11.3 


方法 1: 模块 、 包 


| 什么 是 模块 、 包 


一 个 程序 中 有 多 个 构成 要 素 ， 它 们 之 间 存 在 相互 作用 。 如 图 11.4 所 
示 ， 每 个 图 形 都 由 10 个 要 素 和 21 个 相互 作用 关系 构成 。 那 么 其 中 哪个 
更 便于 理解 呢 ? 


和 图 11.4 哪个 更 容易 理解 


图 灵 社区 会 员 cindy282694 专 享 尊重 版 权 


11.3 ”方法 1 :模块 包 | 177 


以 前 的 程序 设计 中 ， 枉 数 和 变量 是 处 于 同等 地 位 并 且 散 布 在 程序 中 
的 。 不 管 哪个 函数 、 哪 个 变量 ， 在 程序 的 任何 位 置 都 能 访问 。 但 是 ,为 
了 设计 出 更 容易 理解 的 程序 ， 于 是 出 现 了 互相 有 紧密 联系 的 组 。 与 使 所 
有 的 元 素 都 和 其 他 元 素 保 持 同 等 的 作用 相 比 ， 把 关联 性 强 的 几 个 元 素 归 
集 在 一 起 的 方式 更 有 助 于 理解 。 

1978 年 左右 开发 出 来 的 Modula-2” 导入 了 模块 的 概念 ， 显 示 地 表达 
了 这 种 关联 性 强 的 几 个 函数 和 变量 的 组 合 。 至 今 很 多 编程 语言 都 延续 了 
这 个 机 制 。Python 语言 和 Ruby 语言 继续 把 它 称 为 模块 ， 而 Java 语言 和 
Perl 声言 则 把 它 称 为 包 。 

模块 是 一 种 归 集 的 方法 。 既 然 如 此 ， 那 是 不 是 可 以 借助 它 来 归 集 变 
量 和 函数 ， 从 而 设计 现实 世界 中 的 物 的 模型 呢 ? 


‖ 用 Pen 语言 的 包 设计 对 旬 


Perl 语言 中 的 包 是 一 种 能 将 函数 和 变量 打包 并 命名 的 一 种 功能 。 接 
下 来 ， 我 们 使 用 这 种 包 来 设计 现实 世界 的 物 的 模型 。 
这 里 我 们 要 设计 的 是 交通 流量 调查 使 用 的 和 日 本 野 乌 协会 用 来 统计 乌 类 
数量 的 计数 般 ， 想 必 大 家 对 这 个 都 耳 见 能 许 了 。 这 种 计数 融 实 现 了 按 下 
按钮 显示 数字 增加 ， 按 下 复位 按钮 显示 数字 归 零 的 功能 。 其 中 有 “ 按 下 
按钮 ”和 “ 按 下 复位 按钮 ”两 种 操作 ， 以 及 “显示 的 数字 ”这 一 个 值 。 


用 Petz1 语 言 的 包 设 计 计 数 器 


package Counter.,; 
i SECoune = 0; 
my Sname = " 麻 难 "; 


Su Dust 
SCOUNEt++; 


print "sname: SGCountAH\nA; 


JJ Modula-2 语言 的 设计 者 尼古拉斯 沃 斯 ( Niklaus Wirth ) 曾经 说 过 ，Modula-2 的 
祖先 是 Pascal 语言 和 Modula 语言 。Modula-2 从 后 者 继承 了 名 字 、 模 块 这 一 重要 
的 概念 以 及 系统 和 现代 的 语法 结构 ， 其 余 的 特点 则 几乎 都 是 从 Pascal 语言 继承 而 
来 的 。 请 参考 Niklaus Wirth, Proeramming in Modula-2, Springer-Verlag, 1989, p.143。 
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sub reset{ 
Soe 0 


print "smname: 重 置 \n"; 


} 


Counter: :push; #-> 麻雀 : 1 只 
COUNnEer ousn #-> 麻生 : 2 只 
CoUunter. ousn. #-> 麻生 : 3 只 
CoUunEer ect #-> 麻 众 : 重 置 
COUunter -un #-> 麻 从 : 1 只 


如 此 便 大 功 告 成 了 ! 这 里 实现 了 一 个 在 计算 机 上 称 为 Counter 的 模 
型 ， 执 行 一 次 Counter : : push 数值 加 1， 执 行 一 次 Counter : : reset 数值 
归 去 。 这 和 在 野 乌 数量 统计 时 按 下 按钮 数字 加 1， 按 下 复位 按钮 数字 归 
去 是 一 样 的 动作 。 这 样 就 在 计算 机 中 实现 了 现实 世界 中 物 的 模型 。 


| 光 有 模块 不 够 用 


然而 ， 光 有 模块 是 不 够 的 。 我 们 回 到 日 本 野马 协会 的 计数 需 的 例 
子 。 假 设 这 一 次 要 统计 麻 省 和 乌鸦 分 别 的 数量 ， 并 且 洋 了 两 个 相同 的 这 
种 计数 希 ， 分 别称 为 A 和 B。 计 数 希 A 和 计数 右 B 有 相同 的 型 号 、 相 
同 的 功能 ， 因 此 属于 同一 种 类 型 。 但 这 不 是 同一 个 东西 。 按 下 计数 需 A 
的 按钮 ， 表 示 的 数字 会 加 1， 而 计数 右 B 的 数字 却 不 会 改变 。 

函数 和 模块 ， 每 定义 一 次 就 对 应 计算 机 上 的 一 个 新 的 实体 。 而 现实 
世界 中 党 第 有 相似 的 事物 同时 存在 多 个 的 情况 。 怎 样 才能 将 这 种 现实 世 
界 的 构造 在 计算 机 上 用 模型 表现 出 来 呢 ? 把 Counter 包 选 定 、 复 制 ， 分 
别 创 建新 的 包 Counter A 和 Counter B， 是 不 是 就 可 以 呢 ? 当然 ， 这 样 做 
是 可 以 实现 的 。 但 有 谁 会 愿意 为 表达 10 个 相似 的 东西 ， 对 一 段 代 码 复 
制 10 次 然后 去 维护 10 段 完全 相同 代码 呢 ? 估计 大 家 都 不 喜欢 。 我 们 需 
要 一 种 更 加 便捷 的 方法 “。 


QQ) 一 言 以 蔽 之 ， 就 是 想 要 创建 多 个 实例 。 
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| 分 开 保存 数据 


我 们 来 整理 一 下 面临 的 问题 。 函 数 和 模块 的 定义 和 实体 是 一 对 一 
的 。 按 下 按钮 数字 增加 1 的 操作 对 于 计数 带 A 和 计数 大 B 都 是 相通 的 。 
从 这 个 意义 上 来 讽 ， 只 需要 一 个 计数 天 就 足够 了 。 

但 是 计数 器 的 值 对 于 计数 需 A 和 计数 器 B 是 不 同 的 。 计 数 器 A 的 
值 变化 了 ， 也 不 能 影响 到 计数 融 B 的 值 。 从 这 个 意义 上 来 说 ， 又 确实 需 
要 多 个 计数 天。 

也 就 是 赔 ， 如 果 有 方法 能 分 开 保存 数据 就 可 以 了 “。 


i 向 参数 传递 不 同 的 散 列 


Perl 语言 的 语言 处 理 融 本 里 就 市 有 我 们 在 第 9 章 学 习 的 字典 〈 和 名 字 
与 值 的 对 照 表 ) 创建 功能 。Perl 语言 中 称 之 为 散 列 。 那 么 把 散 列 用 于 存 
储 数据 会 怎么 样 呢 ? 关于 函数 的 定义 我 们 不 做 任何 改变 ， 继 续 使 用 包 作 
归 集 。 在 函数 调用 时 ， 把 散 列 作为 实 参 传递 给 被 调用 函数 。 


(EO) 
{ 


package Counter.,; 
SsuD Dusen 
my S$values = shift,; 


0 
$values->{count}++; © 
口 


# 创建 散 列 
IE 


De 0 


# 全 将 散 列传 递 给 参数 


Counter: :push ($counter),; #-> 1 只 


〇 C++ 语言 中 可 以 实现 一 个 用 户 定 义 类 型 对 应 多 个 变量 的 形式 ,这 一 点 将 在 后 面 介 绍 。 
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Counter: :push ($counter),; #-> 2 只 
Counter: :push ($c2); 入 = 工具 
Counter: :push (Scounter); #-> 3 只 
Counter: :push ($c2); 六 -=> 马上 只 


例句 中 的 {"count" => 0} 部 分 定义 了 一 个 键 名 为 "count" 对 应 的 值 
为 0 的 散 列 。 这 里 定义 了 两 个 不 同 的 散 列 $counter 和 $c2 作为 数据 的 保 
管 场 所 ， 然 后 将 它们 作为 参数 传递 给 Counter 包 中 的 push 孙 数 (@ )。 
push 国 数 中 的 各 名 的 意思 是 取出 实 参 中 的 一 个 数值 ， 代 入 $values 中 。 
随后 ， 计 数 硕 加 1 (@ )， 并 打印 输出 (全 )。 从 这 里 我 们 可 以 看 出 ， 两 
个 计数 硕 是 分 别 独 目 增长 的 ， 这 便 和 现实 世界 中 的 计数 天 一 样 了 。 
$counter 的 值 不 会 干涉 到 $c2 的 值 ， 这 是 因为 两 者 是 不 同 的 对 象 ， 各 日 
维持 目 身 的 状态 。 


| 把 初始 化 处 理 也 放 入 包 中 


然而 ， 在 这 一 实现 方式 下 每 创建 一 个 新 的 计数 器 时 ， 程 序 员 都 必需 
编写 { "count" => 0}。 也 就 是 说 ， 程 序 员 必须 记 住 如 何 初始 化 这 些 值 。 
这 不 是 一 种 好 的 设计 方式 。 对 于 这 种 定型 的 操作 ， 相 比 人 为 地 记 住 并 加 
以 注释 说 明 ， 用 代码 去 表现 这 种 操作 的 方式 显然 要 更 好 。 这 样 就 促成 了 
初始 化 操作 的 吨 数 化 ， 并 把 它 放 和 人 包 中 。 

我 们 马上 来 看 一 看 这 是 如 何 做 到 的 。 下 面 的 代码 中 增加 了 一 个 名 为 
new 的 晒 数 。 


{ 


package Counter; 
sub newl{ 
return {"value" => 0}; 
} 
su pusnt! 
my S$Svalues = shift,; 
$values->{count}++; 


print "$values->{count} 人 RA\n"; 
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# 把 初始 化 处 理 放 入 包 中 
my Scounte = Counter: :new; 


my $c2 = Counter::new; 


# 把 散 列 传递 给 参数 


Counter: :push ($counter); #-> 工具 
Counter: :push ($counter); #-> 2 只 
Counter: :push ($c2); #-> 1 只 
Counter: :push ($counter); #-> 3 只 
Counter: :push ($c2); #-> 2 只 


把 初始 化 操作 定义 为 名 为 new 的 孔 数 ， 这 样 程序 员 在 每 次 创建 新 的 
计数 需 时 ， 只 要 编写 代码 Counter : : new 就 可 以 实现 了 。 在 语言 功能 
并 不 是 强制 要 求 这 样 来 写 ， 但 这 样 写 的 好 处 是 使 得 程序 变 得 更 加 简明 清 
晰 。 这 也 可 以 说 成 是 一 种 设计 模式 。 像 new 这 样 创建 新 的 对 象 的 函数 被 
称 为 构造 函数 ( constructor ) "。 


| 把 散 列 和 包 绑 定 在 一 起 


到 目前 为 止 ， 我 们 要 实现 的 目的 已 经 能 达到 了 ， 但 Counter : : 
push($counter) 看 起 来 总 觉得 过 于 见长 。$counter 本 里 就 是 为 了 与 
Counter 包 配 套 使 用 而 创建 出 来 的 ， 每 次 在 使 用 包 时 必须 一 一 指定 
Counter : : ， 这 是 件 很 且 烦 的 事情 。 应 该 可 以 有 更 加 轻松 的 实现 方式 。 

我 们 考虑 是 否 可 以 让 语言 处 理 需 记 住 这 个 散 列 是 和 Counter 包 配 套 
使 用 而 创建 出 来 的 这 一 信息 。 为 达成 此 目的 ，Perl 语言 引入 了 bless( 视 
福 ) 这 一 概念 ， 并 提供 了 bless 因 数 ， 它 可 以 把 散 列 和 包 两 者 绑 定 在 一 


由 我 们 已 经 多 次 强调 ， 语 言 不 同 术 语 的 含义 会 有 差异 。 比 如 在 Java 语言 中 构造 函 
数 (constructor ) 的 含义 更 为 有 限 。 这 个 例子 在 Java 语言 中 的 表达 是 Counter. 
newJInstance( ) 这 一 方法 ， 但 它 不 叫做 构造 函数 而 是 叫做 工厂 方法 (factory 
method )。 
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起 ， 创 建 一 个 blessed hash。 
在 前 面 的 程序 末尾 补充 以 下 几 行 代码 。 


{ 


my $counter = {"value" => 0}; 
print "Scounter\n".; 

#-> 输出 HASH (0x1008001£0)@ 

# 这 是 没有 被 bless 的 散 列 


# 把 散 列 和 包 绑 定 一 起 

ess SUNIEETSAUGSUWIEETSLU LE 
SWEET 

#- > 输出 counter=HASH(0x1008001£f0)@ 
# 这 是 被 bless 的 散 列 


$counter->push; #-> 1 只 # 轻松 地 使 用 第 头 运 算 符 ! 


scounter->push; #-> 2 内 


在 被 bless 之 前 创建 的 $counter 显示 出 来 是 @ 的 样子 ， 而 使 用 了 
bless 国 数 之 后 创建 的 $counter 显示 出 来 是 @ 的 样子 。 散 列 和 Counter 包 
已 经 绑 定 配套 ， 变 成 了 blessed hash。 

并 且 ， 在 被 bless 的 散 列 使 用 箭头 运算 符 -> 后 ， 程 序 会 到 与 之 绑 定 
的 名 字 的 包 中 寻找 相应 的 函数 ,把 该 散 列 传递 给 该 函数 并 调用 “。 在 这 个 
例子 中 ，$counter->push 一 名 执行 时 ， 会 到 与 $counter 绑 定 在 一 起 的 名 
为 Counter 的 包 中 寻找 名 为 push 的 函数 ， 把 $counter 作为 参数 传递 给 这 
个 函数 并 调用 它 。 

通过 把 数据 的 保存 场所 和 数据 操作 的 集合 (模块 ) 绑 定 在 一 起 ， 看 
上 去 就 变 成 一 个 整体 ， 非 党 清晰。 而 绑 定 操作 本 身 也 是 一 个 定型 的 操 
作 ， 故 把 它 一 起 放 进 new 本 数 中 。 


sub new{ 


my S$Sclass = Shift， 


my $values = {count => 0}; 


(DD 严格 来 讲 ，bless 的 不 是 散 列 而 是 散 列 的 引用 。 
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bless Svalues, Sclass,; 


这 样 一 来 ， 通 过 $counter = Counter : : new 就 创建 了 一 个 新 的 计数 
售 ， 通 过 $counter->push 就 实现 了 按 下 这 个 计数 大 按钮 的 功能 ， 这 样 看 
上 去 十 分 商洛 清 晰 。 

综 上 ， 通 过 使 用 一 系列 的 方法 ， 我们 实现 了 野 乌 计数 右 的 整体 建 
模 ， 可 以 创建 对 象 (Counter : : new)， 也 可 以 为 这 个 对 象 命名 (my 
$counter = ...)， 还 可 以 操作 这 个 对 象 ($counter-> push)。 于 是 ， 在 计算 机 
中 创建 现实 世界 中 的 物 的 模型 这 一 目的 就 很 好 地 达成 了 。 


11.4 


方法 2: 把 函数 也 放 入 散 列 中 


| first class 


Perl 语言 中 使 用 包 把 多 个 函数 归 集 在 一 起 。 接 下 来 ， 我 们 要 介绍 的 
是 JavaScript 语言 中 使 用 的 男 一 种 归 集 方法 。 这 种 方法 把 函数 也 放 入 散 
列 中 。 

大 家 使 用 的 编程 语言 大 多 应 该 可 以 把 字符 串 赋值 给 变量 。 也 可 以 把 
它 作 为 函数 的 参数 传递 或 作为 子 数 的 返回 值 返回 。 或 许 你 会 觉得 这 是 理 
所 当然 的 事情 。 事 实 上 ， 并 非 所 有 的 语言 都 如 此 。 比 如 ，FORTRAN 66 
中 就 不 能 把 字符 串 赋值 给 变量 。 男 外 ，C 语言 中 就 不 可 以 把 数组 作为 参 
数 来 调用 函数 "。 

像 这 种 不 受 限 制 ， 可 以 赋值 给 变量 ， 也 可 以 作为 函数 的 参数 传递 ， 
叉 可 以 作为 函数 的 返回 值 返 回 的 值 被 称 为 first class 的 值 。 这 好 比 不 受 任 
何 歧 视 的 一 等 公民 ( first-class citizen )。 最 新 出 现 的 一 些 编 程 语言 中 ， 如 
Java 语言 、Perl 语言 和 Python 语言 ， 字 人 符 串 束 是 first class 的 值 。 


@D 看 起 来 像 是 把 数组 或 者 字符 串 传 递 给 了 函数 , 事实 上 只 是 指向 数组 开头 位 置 的 指针 。 
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在 JavaScript 语言 中 ， 函 数 也 是 first class 的 值 。 函 数 可 以 被 赋值 给 
变量 ， 可 以 作为 郴 数 的 返回 值 返回 。 接 下 来 ， 我 们 来 考察 利用 这 一 特征 
可 以 实现 哪些 功能 。 


| 把 函数 放 入 散 列 中 


JavaScript 中 的 散 列 是 用 如 下 语句 定义 的 。 
CS》 


(count 0 ane 人 EE 
这 里 像 0 和" 麻 父 "这样 表达 值 的 部 分 ， 可 以 放 入 函数 function( ) 
(eS 


1 图 11.5 counter 是 散 列 


counter 


接 下 来 ， 我 们 来 看 这 是 如 何 实现 的 。 下 面 的 代码 和 11.3.2 节 中 介绍 
的 内 容 大体 相 同 ， 实 现 了 野 乌 计数 硕 的 功能 。 


JavaScript 


var counter = f{ 


Gu 


name: "麻雀 "， 


Dush finet | 
this.count++; 
console.log(this.name + ": "+ 
Enig,. COumaE 4 VRr);s 
I 


reset: function(){ 


记忆 二 号 COU 三 0; 
console.log(this.name + ": "+ 
" 重 置 ") ; 
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} 


counter.push(); //-> 有 斥 从 : 1 
counter.push(); //-> 麻利 : 2 只 
counter.push(); //-> 麻 众 : 3 
counter.reset () ;//-> 麻 众 : 重 置 
counter pash()。//=> 订 企 1 风 
在 Perl 语言 中 是 通过 包 来 实现 的 ， 而 在 JavaScript 语言 中 是 通过 散 
列 实 现 的 。 此 外 有 没有 别 的 不 同 之 处 呢 ? 乍 一 看 ， 还 有 关键 字 this 的 使 
用 这 一 区 别 。this 是 一 个 限定 词 ， 在 吗 数 my method( ) 与 对 象 obj 绑 定 
之 后 通过 obj.my_ method( ) 的 形式 调用 此 也 数 时 ,this 用 于 在 my _ 
method( ) 函数 中 引用 obj 对 象 本 号 。 前 面 的 Perl 语言 的 例子 中 ， 我 们 用 
my $value = shift 语句 来 显 式 地 获取 参数 ， 而 JavaScript 语言 中 却 是 隐 式 
地 借助 了 this 这 一 变量 来 表示 。 上 述 的 例子 中 通过 counter.push( ) 语句 
来 调用 函数 ， 因 此 push 也 数 中 使 用 的 this 变量 指 的 就 是 counter。 所 以 
这 个 例子 中 把 this 替换 成 counter 程序 也 是 可 以 正常 执行 的 。 
这 个 例子 和 使 用 包 的 例子 都 有 一 个 共通 的 问题 ， 就 是 只 能 创建 一 个 
计数 需 。 但 是 这 里 要 创建 多 个 计数 需 也 不 是 困难 的 事情 。 下 面 我 们 就 来 
展示 这 是 如 何 做 到 的 。 


| 创建 多 个 计数 器 


为 了 创建 多 个 计数 右 ， 我 们 需要 定义 一 个 散 列 初始 化 的 函数 。 编 写 
这 样 一 个 函数 是 出 乎 意料 的 简单 ， 只 需要 把 创建 散 列 的 代码 挪 到 
makeCounter 函数 中 就 可 以 。 这 样 就 达到 了 和 Perl 语言 中 使 用 包 一 样 的 
效果 ”， 即 : 

e 可 以 创建 多 个 对 和 象 

e 外 观 上 是 一 个 完整 不 可 分 的 整体 

e 无 天 人 为 记 住 初始 化 方法 


C 〇 因 篇 幅 所 限 ， 这 里 省 略 了 reset 方法 。 
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JavaScript 


function makeCounter(){ 
Peturn | 
GoUnniac es 人 
EeeETOm RN 
this.count++; 


Gangsols 1 Go 人 (ES ee 


Var cl = makeCounter(); 
= makeCounter(); 
(3 = 工具 

ca .US ) //=> 工具 
2 


Wai 全 之 


al ,ouan (ys 


a@l .dauan() 


| 把 共享 的 属性 放 入 原型 中 


刚才 的 代码 中 ， 每 次 创建 计数 带 时 都 会 重新 定义 一 个 push 果 数 。 
用 以 下 语句 确认 cl.push 和 c2.push 是 否 相 同时 ， 返 回 值 是 false。 这 意味 
者 两 者 是 不 同 的。 


conselem ee un eu se 


这 是 什么 原因 呢 ? 在 每 次 调用 makeCounter 时 push: funtion( ){...} 会 
被 执行 ， 定义 一 个 新 的 函数 。 也 就 是 说 ， 创 建 100 个 计数 器 ， 就 会 有 
100 个 内 容 相 同 的 push 晒 数 被 定义 。 如 果 内 存 和 CPU 可 以 无 限 供应 时 ， 
这 不 是 什么 问题 。 但 现实 没有 这 人 么 美好 。 如 果 能 把 push 呆 数 这 样 所 有 
计数 需 都 共享 的 属性 归 集 起 来 ， 个 别 计数 锅 只 是 对 其 做 引用 ， 这 样 应 该 
能 市 省 内 存 和 时 间 (图 11.6 )。 
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1 图 11.6 把 共享 的 属性 归 集 起 来 


| 归 集 共享 

| 部 分 

;计数 器 c1 计数 器 c2 | | 

| count count | | 
| push push ! 


然而 ， 归 和 集 起 来 后 就 要 记得 放 入 了 哪里 ,使 用 的 时 候 还 要 显 式 地 指 
不 出 来 ， 这 样 很 并 烦 。 把 共 至 的 内 容 放 在 别 的 对 象 中 ， 那 就 必须 记 住 这 
一 内 容 放 在 哪个 对 象 中 ， 人 工 来 记忆 这 些 是 令 人 不 快 的 。 如 果 语 言 处 理 
如 能 代劳 并 做 出 正确 的 判断 就 好 了 。 


和 原型 的 操作 

为 解决 这 一 问题 ，JavaScript 语言 引入 了 原型 的 概念 7 了 。 当 向 一 个 对 
象 查询 x 的 值 时 ， 如 采 这 个 对 象 目 己 知道 就 目 己 给 出 答案 。 如 果 不 知 
道 ， 它 会 去 查询 它 的 原型 再 给 出 答案 。 下 面 的 代码 中 ，obj 对 象 就 不 知 
道 x 的 值 是 多 少 。 
CEEEESTDS 


obj = {) 
OD 


console.1og (obj); ES 
eonsole Jegq(oB J] proto 二 下 
elomseonle mee // -> 1 


在 查询 x 的 值 时 (obj.x)，obj 转 回 它 的 原型 (obj. proto _) 才 给 出 
答案 (图 11.7)“。 


JJ 这 里 介绍 的 是 用 委托 的 方式 实现 原型 这 一 概念 的 情景 ， 不 同 语言 中 也 可 以 在 实例 
化 时 通过 负责 实现 。 至 于 这 种 方法 中 当 实 例 化 后 原型 发 生 了 变更 会 怎样 ， 在 不 同 
语言 中 是 存在 差 开 的 。 

@ 通过 ”proto 这 个 名 字 访 问 原型 并 不 是 标准 功能 ， 根 据 处 理 器 的 不 同 会 有 不 同 
的 可 能 性 。JavaScript 1.8.1 开始 引入 了 Object.getPrototypeOf (object) 的 表达 方式 。 
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有 图 11.7 查询 obj.x 时 发 生 的 事情 


@X 为 何 值 ? 
四 为 1 


@X 为 何 值 ? 
四 不 知道 ， 查 询 __proto__ 


© 原型 回复 说 是 1。 
@ 为 1 ! 


目 用 new 运算 符 实现 高 效 表 达 

除 此 之 外 ，JavaScript 语言 还 引入 了 一 种 使 得 原型 处 理 的 表述 更 加 
方便 的 运算 符 。 在 函数 了 前 使 用 new 运算 符 后 会 执行 以 下 四 个 操作 : 

e 创建 新 的 对 象 x 

e 新 创建 的 对 象 x 的 原型 变 为 函数 f 的 原型 

e 把 新 创建 的 对 象 x 传 给 this， 执 行 函 数 f 的 内 容 


e 返回 对 象 x 
var CoOUnter fnceeliom() | 

Eanis, GounE 三 0; /7/ 1 
} 
Counter Brovotvoe US 和 SET 人 © 


hoe eouneer. 


eomseole Noel ee 


Kenerene ewevee 全 感人 © 

el1 ,5ush() ;7 /和 三 三 工具 

al.usn() 7 //=> 2 只 

Var C2 = new Counter(); 

console.log(ci.push === c2.push) //-> true // @ 相 同 


这 上 段 代 码 中 ， 首 先 通 过 人 @ 各 在 Counter 的 原型 中 追加 了 一 个 名 为 
push 的 新 的 函数 。 在 随后 的 合 句 执行 了 上 述 四 个 操作 。 首 先 创建 了 一 个 
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空 的 对 象 ， 然 后 将 这 个 对 象 的 原型 设 为 Counter 的 原型 。 这 个 原型 中 定 
义 了 push 晒 数 。 接 下 来 ， 把 这 个 对 象 传 给 this， 再 调用 Counter。 
Counter 中 包含 @ 句 的 内 容 。 执 行 这 些 内 容 会 往 这 个 对 象 中 妃 加 一 个 名 
字 为 count 值 为 0 的 属性 。 最 后 ， 返 回 一 个 原型 中 包含 push 困 数 的 、 读 
有 count 属 性 的 对 象 。 不 经 意 间 我 们 就 实现 了 图 11.6 右边 部 分 的 结构 。 
全 和 句 返 回 值 是 tue， 由 此 可 知 push 函数 已 经 是 共享 的 了 。 


| 这 就 是 面向 对 象 吗 


在 Java 语言 中 学 过 面向 对 和 象 的 读者 可 能 会 心里 犯 咬 号 ， 觉 得 到 现在 
为 止 讲 的 内 容 远 远 不 够 。 有 些 人 其 至 可 能 要 发 怒 ， 质问 为 什么 关于 类 的 
话题 还 没有 任何 涉及 。 

笔者 认为 ， 不 知道 面 品 对 和 象 的 读者 当中 很 多 读者 也 不 知道 何 为 类 。 
只 是 大 家 看 的 此 类 书籍 都 是 从 类 开始 讲 面 回 对 象 的 。 

的 确 ，Java 语言 是 一 门 编程 必 从 类 开始 的 语言 。 笔 者 也 深 襄 ， 在 教 
授 Java 语言 程序 设计 时 ， 不 先 详细 讲解 并 使 之 学 会 使 用 类 是 不 行 的 。 然 
而 ， 类 并 不 是 从 程序 设计 语言 诞生 之 日 起 就 存在 的 。 它 充其量 只 不 过 是 
几 二 年 前 某 个 人 出 于 提高 便利 性 的 需要 ， 试 春 创作 出 来 的 东西 而 已 。 尽 
管 如 此 ， 我 们 总 是 被 提醒 类 的 存在 并 被 焉 励 去 使 用 它 ， 但 又 不 太 明 日 类 
为 什么 是 必要 的 。 

类 的 存在 只 不 过 是 因为 人 们 党 得 有 了 它 编 写 程 序 会 更 方便 些 ， 而 约 
定 的 一 种 事项 。 它 并 不 是 什么 物理 法 则 或 宇宙 真理 ， 仅 仅 是 人 们 的 一 种 
约定 而 已 。 所 以 ， 为 了 理解 为 什么 会 有 这 样 一 种 约定 ， 我 们 需要 考虑 请 
言 设计 者 的 意图 。 
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11.5 
方法 3: 闭 包 


| 什么 是 闭 包 


说 到 闭 包 (closure ) 这 个 概念 ， 想 必 很 多 人 一 时 也 说 不 出 究 葛 何 为 
闭 包 。 它 是 创建 具有 对 象 性 质 的 事物 的 一 种 技术 。 

很 多 语言 都 文 持 定 义 融 有 某 种 状态 的 函数 。 比 如 ， 可 以 定义 像 计 数 
伪 一 样 每 调用 一 次 显示 的 数字 加 1 的 晒 数 。 我 们 用 JavaScript 语言 来 实 
现下 


JavaScript 


function makeCounter(){ 


VE GOUE = 0; 
Fane lon pus 
Count++; 


console.log (count); 


} 


return push,; 


区 makeCounter () ，; 


GO 0 
0 人 
G(s 2 

这 段 代 码 中 ， 贞 数 makeCounter 中 定义 了 变量 count 和 滑 数 push， 
并 返回 函数 push。 然 后 ， 通 过 调用 困 数 makeCounter 将 返回 值 赋 给 变量 
c， 然 后 调用 它 三 次 。 每 调用 一 次 ， 显 示 的 值 就 加 1。 这 是 怎么 做 到 的 
呢 ? 也 数 makeCounter 首先 创建 了 一 张 名 字 和 值 的 对 照 表 ， 把 变量 count 
的 值 设 为 0。 然后 定义 了 因数 push， 并 将 其 返回 。 函 数 push 将 其 被 定义 
时 的 对 照 表 一 同 溃 出 makeCounter 晒 数 。 随 后 ， 每 当 被 调用 时 ， 郴 数 
push 在 被 定义 时 的 对 照 表 的 值 就 加 1。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


11.6 方法 4: 类 | 191 


事实 上 , 并 没有 所 谓 闭 包 的 特殊 的 语法 结构 。 如 果 有 一 种 语言 ”, 它 
可 以 在 函数 中 定义 函数 ， 有 允许 想 套 的 静态 作用 域 ， 并 且 可 以 把 函数 作 
为 返回 值 传 递 给 变量 ， 那 么 它 只 要 通过 函数 的 般 套 就 可 以 实现 带 有 某 种 
状态 的 函数 。 


| 为 什么 叫做 闭 包 


看 到 闭 包 这 个 名 字 ， 总 有 一 种 什么 东西 被 严实 地 包 右 起 来 了 的 感 
党 。 为 什么 会 叫做 闭 包 呢 ? 革 Standard ML 的 教材 上 做 了 如 下 解释 。 
为 什么 把 这 称 为 闭 包 ? 一 个 包含 了 自由 变量 的 开放 表达 式 ， 它 
和 该 自由 变量 的 约束 环境 组 合 在 一 起 后 ， 实 现 了 一 种 封闭 的 状态 。 


一 一 Ake Wikstrdm, Functional programming using standard ML, Prentice-Hall, 1987." 


拿 上 面 一 段 代码 来 计 ， 也 数 push 使 用 了 变量 count， 然 而 该 变量 并 
不 是 在 函数 push 中 定义 的 。 这 种 变量 被 称 为 日 由 变量 。 也 数 push 就 是 
一 个 包含 了 目 由 变量 的 开放 哨 数 。 而 函数 makeCounter 的 对 照 表 中 为 0 
的 值 和 为 count 的 名 字 绪 合 在 了 一 起 。 这 种 给 值 绑 定 一 个 名 字 的 操作 叫 
做 (名字 ) 约束 。 这 样 开 放 郴 数 push 和 makeCounter 的 对 照 表 组 合 配套 
之 后 ， 无 需 在 这 以 外 的 作用 域 中 寻找 变量 的 定义 ， 从 而 达到 了 某 种 完备 
的 状态 。 通 过 这 样 表 现 出 一 种 封闭 的 属性 。 


11.6 


方法 4: 类 


那么 ， 何 为 类 ? 它 是 语言 设计 者 在 特定 语言 中 规定 的 一 些 称呼 ， 具 
有 多 种 定义 。 


(D 大 部 分 的 函数 式 语言 和 JavaScript 语言 以 及 Python 语言 都 满足 这 一 条 件 。Perl 语 
言 和 Ruby 语言 经 过 一 些 处 理 也 可 以 符合 这 一 要 求 。 

(2) 原文 是 “The reason it is called a ‘closure’ is that an expression containing free variables 
is called an“open ”expression, and by associating to it the bindings of its free variables, 


you close it” 。 
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/ 


Er 、 漆 
| 霍 尔 设想 的 类 


首先 来 看 原始 形态 的 类 是 怎么 定义 的 。1965 年 霍 尔 在 ALGOL 的 扩 
展 方 案 中 写 道 :“ 基 于 便利 性 的 考虑 ， 现 在 世界 中 的 物 ( objects ) 通常 被 
分 为 几 种 独立 的 分 类 ， 而 某 种 分 类 的 物 如 能 进一步 分 为 更 细 的 类 别 
( subclasses ) 就 更 方便 了 "。” 

从 这 上 段 话 能 看 出 来 ， 他 所 谓 的 类 就 是 分 类 。 它 和 我 们 日 常 说 的 
economy class ( 经 济 舱 ) 中 的 class 以 及 分 组 对 抗 赛 中 的 分 组 属于 相同 的 用 
法 。 现 在 C++ 语言 和 Java 语言 中 使 用 的 class 一 词 被 追加 了 很 多 意思 变 得 
复杂 起 来 ， 但 最 初 都 是 分 类 的 意思 。 现 在 所 说 的 类 的 继承 以 及 类 是 像 做 鳃 
鱼 烧 一 样 创建 实例 的 钢 鱼 烧 的 模具 ， 这 些 说 法 都 是 后 来 才 出 来 的 概念 。 


| C++ 语言 中 的 类 


十 年 之 后 的 1979 年 ， 本 页 尼 ' 斯 特攻 期 特 户 普 开 始 了 C with 
Classes 的 开发 。 这 也 就 是 之 后 的 C++ 语言 。C++ 语言 中 类 的 概念 是 以 
Simula 这 种 仿真 用 语言 ”中 的 类 为 参考 ， 方 便 用 户 定 义 类 型 (type ) 而 
设计 出 来 的 。 斯 特 邦 期 特 户 普 是 这 样 解释 的 : 


类 是 类 型 。 这 是 C++ 语言 中 极为 重要 的 一 种 思想 。 既 然 C++ 
语言 中 类 的 意思 就 是 用 户 定 义 的 类 型 ， 那 为 什么 不 把 它 叫 做 type 
呢 ? 我 之 所 以 选择 使 用 class， 是 因为 实在 不 喜欢 不 断 地 创造 新 词 ， 
才 选 用 Simula 语言 中 class 这 个 谁 都 不 至 于 困惑 的 词 。 

斯 特 劳 斯 特 卢 普 《 C++ 语言 的 设计 与 演化 》 


能 让 用 户 定义 新 的 、 操 作 起 来 如 同 int 和 float 这 样 内 置 型 的 类 型 ， 
这 是 C++ 语言 中 引入 类 的 目的 。C 语言 中 也 有 能 将 各 种 变量 归 集 到 一 起 
定义 新 的 结构 体 的 功能 。C with Classes 中 的 类 最 初 就 是 C 语言 中 的 结 
构 体 。 之 后 ， 斯 特 劳 斯 特 卢 普 把 他 认为 好 用 的 功能 陆续 加 入 了 进来 。 其 


QD) 这 是 从 “RECOAD HANDLING” 第 3 页 和 第 15 页 翻译 而 来 的 。 
(2 Simula 是 一 种 专注 于 仿真 的 程序 设计 语言 。 在 这 种 语言 中 ， 由 类 创建 的 对 象 会 在 
协调 的 多 线程 模式 下 ， 像 Erlang 语言 的 进程 一 样 执行 并 行 处 理 。 
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中 之 一 就 是 功能 说 明 的 作用 。 


| 功能 说 明 的 作用 


对 于 C++ 语言 来 计 ， 类 ( = 类 型 ) 也 是 功能 说 明 的 一 种 表现 形式 。 
也 就 是 说 ， 类 起 春 一 种 作用 ， 它 可 以 声明 对 象 具有 哪些 方法 和 不 具有 哪 
些 方法 。 如 果 程 序 调 用 了 不 存在 的 方法 会 导致 编译 错误 。 这 也 是 
Smalltalk 语言 和 C++ 语言 一 个 很 大 的 区 别 “。 

在 Smalltalk 语言 中 ， 方 法 的 调用 就 是 向 对 象 传送 一 个 消息 ， 告 诉 它 
去 执行 某 某 名 字 的 方法 。 至 于 对 象 接收 到 这 个 消息 后 如 何 啊 应 〈 执行 
什么 操作 还 是 导致 错误 还 是 不 作 任 何人 处 理 )， 这 可 以 由 接收 方 的 对 象 
目 由 决定 。Smalltalk 语言 的 设计 者 同时 也 是 面 癌 对 象 一 词 的 发 明 者 的 
艾 伦 : 凯 认 为 ， 这 样 的 自由 度 是 面向 对 象 的 重要 元 陛 之 一 。 


‖ 类 的 = 大 作用 


大 家 是 不 是 觉得 类 这 个 概念 很 复杂 ? 的确 如 此 。 这 是 因为 C++ 语言 
和 Java 语言 的 类 具有 以 下 几 个 作用 : 


@ 整合 体 的 生成 天 
@ 可 行 操 作 的 功能 说 明 
全 代码 再 利用 的 单位 


Perl 语言 和 JavaScript 语言 的 说 明 主 要 集中 在 生成 右 的 功能 方面 。 
类 是 制作 鲁 鱼 烧 用 的 模具 这 一 说 法 讲 的 就 是 这 个 作用 。 

11.6.2 方 介绍 的 是 类 的 功能 说 明 的 作用 。Java 语言 中 可 以 定义 专门 
实现 这 一 功能 的 接口 。 而 动态 类 型 语言 不 太 重 视 这 种 作用 。 

第 12 章 我 们 将 探讨 作用 代码 再 利用 的 单位 的 类 的 作用 ， 即 继承 “。 


© 


请 参考 : 斯 特 劳 斯 特 卢 普 ,，“What is Object-Oriented Programming? (1991 revised 
version)” , 1991, p.15. http://www.stroustrup.com/whatis.pdf 

(2) 当然 ， 并 不 是 说 现在 的 Perl 语言 和 C++ 语言 中 类 作为 代码 再 利用 的 单元 的 作用 消 
失 了 ， 只 是 类 在 不 同 语言 中 发 挥 的 这 种 作用 有 强 弱 之 别 。 另 外 ， 至 少 在 早期 Perl 
语言 的 包 中 并 不 具有 继承 功能 。 
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人 


小 结 


本 章 我 们 学 习 了 面 加 对象 产生 的 原因 ， 它 是 为 了 创建 现实 世界 中 物 
的 模型 而 产后 的。 同时， 我 们 了 解 到 ， 不 同 语 言 中 类 的 实现 方式 以 及 面 
回 对 象 这 一 术语 本 身 的 意义 也 是 不 同 的 。 
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本 章 我 们 来 学 习 继 承 。 
继承 这 一 机 制 也 是 因 语 言 而 异 。 
我 们 将 在 不 同 语言 的 继承 机 制 的 比较 中 来 认识 它们 各 自 的 长 处 与 短处 。 


(ea | 
什么 是 继承 


如 第 11 章 所 述 ， 类 的 最 基本 作用 是 分 类 。 同 一 类 别 的 事物 具有 共 
同 的 属性 。 即 使 将 分 类 进一步 细 化 ， 这 些 属性 还 是 会 被 继承 下 去 。 

假设 你 要 设计 一 个 射击 类 的 游戏 。 游 戏 中 出 场 的 角色 为 具有 位 置 和 
头像 的 模型 ， 并 且 进 一 步 可 以 分 类 为 由 人 操纵 的 已 方 角色 和 由 计算 机 操 
纵 的 敌 方 角色 。 当 然 , 己方 角色 和 敌 方 角色 都 一 样 ， 具 有 位 置 和 头像 的 
属性 。 可 见 分 类 进一步 细 化 后 属性 得 到 了 继承 。 

己方 角色 和 敌 方 角色 在 实际 实现 中 ， 分 别 声明 各 自 的 位 置 和 头像 属 
性 将 是 一 个 重复 工作 。 如 果 类 中 已 经 声明 的 属性 能 在 对 其 进一步 细 分 的 
子 类 ”中 自动 传承 ， 这 种 语言 的 功能 是 非常 好 的 。 因 此 ， 继 承 产生 了 
(图 12.1 )。 


QD 子 类 (subclass ) 是 从 其 他 类 中 继承 而 创建 的 类 。 类 站 从 类 义 继承 得 到 ， 就 可 以 
说 类 了 是 类 X 的 子 类 。 子 类 的 反义词 是 父 类 (superclass )。Y 是 义 的 子 类 同时 也 
意味 着 又 是 了 的 父 类 。 
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1 图 12.1 继承 : 己方 角色 和 敌 方 角色 都 具有 位 置 和 头像 属性 


例 


如 能 使 用 继承 实现 方式 的 功能 ， 那 编程 实现 不 就 变 得 轻松 很 多 吗 ? 
出 于 这 种 考虑 ， 继 承 的 使 用 变 得 广泛 起 来 。 同 样 是 继承 ， 考虑 问题 的 方 
法 和 使 用 方式 不 尽 相 同 。 


| 继承 的 不 同 实现 策略 
继承 的 实现 策略 大 体 可 以 分 为 三 种 。 


和 一般 化 与 专门 化 

第 一 种 策略 是 在 父 类 中 实现 那些 一 般 化 的 功能 ， 在 子 类 中 实现 那些 
专门 的 个 性 化 的 功能 (图 12.2 )。 其 设计 方针 就 是 子 类 是 父 类 的 专门 化 。 
在 更 细致 的 层面 上 ， 它 和 分 类 意义 是 相近 的 ， 这 和 class 三 分 类 的 想法 一 
人 致 。 它 让 人 很 自然 地 意识 到 子 类 就 是 父 类 的 一 种 。 
1 图 12.2 对 一 般 类 的 专门 化 


[TT 
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由 共享 部 分 的 提取 

第 二 种 策略 是 从 多 个 类 中 提取 出 共 至 部 分 作为 父 类 (图 12.3) 它 
和 一 般 化 与 专门 化 的 考虑 很 不 一 样 。 对 于 子 类 是 否 为 父 类 的 一 种 ， 它 的 
答 双 是 否定 的 。 这 种 提取 出 共 圣 部 分 的 设计 方针 是 习惯 了 函数 的 一 种 考 
虑 问题 的 方法 。 
上 图 12.3 ”从 多 个 类 中 提取 共享 部 分 


共享 部 分 的 类 
共享 部 分 处 理 X 


;共享 部 
取出 
处 理 X 处 理 X ' 
处 理 Y 处 理 Z 


目 差异 实现 

第 三 种 打上 略 认为 继承 之 后 仅 实 现 有 变更 的 那些 属性 会 市 来 效率 的 提 
高 (图 12.4) 它 把 继承 作为 实现 方式 再 利用 的 途径 ， 旨 在 使 编程 实现 
更 加 轻松 。 的 确 有 很 多 这 样 的 情况 。 但 这 些 情况 下 通常 子 类 阁 不 是 父 类 
的 一 种 。 


中 图 12.4 ”继承 已 有 的 类 并 实现 差异 部 分 


功能 妃 加 类 
功能 追加 
修改 等 后 
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i 继承 是 把 双 刃 创 


使 用 方法 多 意味 着 继承 这 种 机 制 有 很 高 的 自由 度 。 这 和 我 们 在 第 4 
章 中 接触 到 的 goto 语句 有 点 类 似 。 滥 用 goto 语句 可 能 造成 代码 理解 困 
难 ， 因 此 对 其 使 用 应 加 以 限制 。 与 此 类 似 ， 对 继承 的 使 用 也 有 相同 的 考 
虚 ， 应 该 对 其 加 以 限制 。 尤 其 是 第 三 种 使 用 方法 一 一 继承 已 有 的 类 并 实 
现 差异 部 分 ， 这 种 编程 风格 会 造成 多 层级 的 继承 树 ， 很 容易 导致 代码 理 
解困 难 。 

多 层级 的 继承 树 是 如 何 导致 代码 理解 困难 的 呢 ? 假设 某 个 对 象 具 有 
方法 X， 这 一 方法 的 定义 在 哪里 呢 ? 在 这 个 类 中 ， 它 的 父 类 中 ， 还 是 它 
的 父 类 的 父 类 中 ? 要 知道 答案 就 需要 追溯 继承 关系 检查 多 个 类 “。 此 外 ， 
如 果 你 要 修改 某 个 方法 ， 这 将 影响 到 所 有 的 子 类 ， 以 及 所 有 子 类 的 子 
类 。 影 响 范围 越 广 ， 就 越 难 确定 这 种 修改 会 不 会 带 来 什么 问题 “。 

这 个 和 我 们 在 第 七 章 中 谈 到 的 动态 作用 域 的 问题 非常 相似 。 人 的 理 
解 能 力 是 有 限 的 ， 影 响 范围 太 大 的 话 就 理解 不 了 了 。 影 响 范围 小 理解 起 
来 就 轻松 。 通 过 使 用 继承 实现 代码 的 再 利用 ， 对 于 编写 程序 来 说 代码 编 
写 量 减少 了 ， 工 作 变 轻松 了 。 但 是 反复 使 用 继承 后 代码 的 影响 范围 变 变 
大 了 ， 理 解 起 来 也 困难 了 。 因 此 ， 为 了 保证 理解 的 简易 性 ， 就 要 防止 继 
承 树 的 层级 过 多 。 


‖ 里 氏 四 换 原由 


在 第 6 章 我 们 提 到 过 CLU 语言 ， 它 的 设计 者 乱世 拉 ' 利 斯 科 夫 
(Barbara Liskov ) 等 人 在 1987 年 提出 一 种 原则 一 一 里 氏 置 换 原 则 ， 这 一 
原则 现在 常常 在 创建 子 类 时 作为 注意 点 被 提 太 。 

这 个 原则 可 以 表述 为 : 假设 对 于 TT 类 型 的 对 象 x， 属 性 q(x) 恒 为 
真 。 如 果 S 为 工 的 派生 类 ， 那 么 $ 类 型 的 对 象 y 的 属性 q(y) 也 必须 恒 


OO 


现在 有 很 多 集成 开发 环境 都 可 以 承担 这 种 繁重 的 任务 ， 这 说 明 为 使 编程 这 项 工作 
更 加 轻松 ， 相 关 工 具 也 得 到 了 进化 。 

这 个 问题 不 是 单 靠 在 程序 设计 上 下 工夫 就 能 解决 的 ， 同 时 也 可 以 把 大 量 的 检查 工 
作 交 给 计算 机 去 完成 来 帮助 解决 ， 这 巴 回归 测试 。 解 决 问题 的 方法 总 是 有 很 多 种 。 


© 
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为 真 "。 

这 名 话 换 种 表达 就 是 ， 对 于 类 工 的 对 象 一 定 成 立 的 条 件 ， 对 于 类 T 
的 子 类 $S 的 对 象 也 必须 成 立 ”。 

语言 表达 可 能 比较 难 理解 ， 我 们 用 图 来 说 明 ( 图 12.5 )。 符 合 置换 
原则 的 情况 如 图 左边 所 示 ， 类 工 的 所 有 对 象 都 满足 条 件 q。 并 且 类 工 的 
子 类 类 $ 的 所 有 对 象 都 满足 条 件 q。 从 图 中 可 以 看 出 S 是 T 的 子 集 ， 这 
是 很 自然 的 。 


1 图 12.5 ”里 氏 置 换 原则 


re 符合 置换 原则 符合 置换 原则 “---…-------- 
满足 条 件 q 的 范围 满足 条 件 q 的 范围 

T 类 型 的 值 T 类 型 的 值 
S 类 型 的 值 S 类 型 的 值 


打破 置换 原则 的 情况 如 图 右边 所 示 。 箭 头 指向 的 部 分 有 不 满足 条 件 
q 的 S 类 型 的 值 。 这 边 S 不 是 工 的 子 集 。 比 如 在 Java 语言 中 ， 如 有 果 S 是 
TI 的 子 类 ， 那 么 可 以 将 类 $ 的 对 象 传递 给 类 工 的 类 型 的 变量 。 即 在 类 型 
系统 中 S 是 工 的 子 集 。 然 而 在 现实 情况 中 ， 最 初 所 有 的 工 都 满足 条 件 
q， 但 S$ 继承 了 T 之 后 就 出 现 了 不 满足 条 件 gq 的 类 T。 因 此 ， 为 了 保证 
类 的 继承 关系 和 类 型 的 父子 关系 这 两 种 关系 之 间 的 一 致 性 ， 有 必要 遵守 
这 一 原则 。 


(D 芭 芭 拉 . 利 斯 科 夫 ， 周 以 真 ,“A behavioral notion of subtyping”, ACM Transactions 
on Proeramming Laneuages and Systems (TOPLAS), Vol.16, Issue 6, ACM, 1994, 
pp.1811-1841. 在 1987 年 的 演说 “Data abstraction and hierarchy” 中 ， 她 们 最 蛙 
提出 了 这 个 思想 。 这 里 的 解说 针对 的 是 1994 年 的 确定 性 说 法 ， 其 原文 表述 是 : 
“Let g(x) be a property provable about objects x of type T. Then g(y) should be provable 
for objects y of type S where S is a subtype of T.”。 

这 里 简单 化 处 理 把 子 类 和 subtype 等 同 视 之 。 至 少 在 C++ 语言 和 Java 语 言 中 这 样 
理解 应 该 没有 问题 。 
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这 一 原则 也 可 以 表达 为 继承 必须 是 is-a 关系 。 把 子 类 $ 的 所 有 对 和 象 
都 看 作 是 父 类 T 的 对 象 而 不 会 有 任何 问题 ， 必 须要 做 到 这 一 点 。 

这 一 约束 条 件 是 非常 严格 的 。 当 要 继承 某 种 类 时 ， 需 要 考虑 该 类 是 
否 可 以 被 继承 。 假 设 继承 的 时 候 考虑 的 属性 可 以 使 里 氏 置 换 原 则 成 立 。 
但 是 在 随后 的 程序 编写 过 程 中 ， 需 要 的 属性 可 能 会 越 来 越 多 。 随 着 属性 
的 增加 ， 和 置换 原则 就 有 可 能 被 打破 。 是 在 设计 阶段 就 把 所 有 属性 列 出 
来 ， 只 有 当 和 置换 原则 绝对 不 被 打破 时 才 去 继承 呢 ? 还 是 在 开发 阶段 如 果 
发 现 新 的 属性 就 放弃 类 的 继承 呢 ? 不 管 哪 种 方式 都 很 费劲 。 


42 
多 重 继承 


我 们 了 解 了 保证 类 的 继承 和 类 型 的 机 制 之 间 的 一 任性 的 难处 。 类 型 
相当 于 我 们 在 第 11 草 中 学 习 的 类 的 三 种 作用 之 中 的 可 行 操作 的 功能 说 
明 。 

为 一 方面 ， 发 挥 类 作为 代码 再 利用 单元 的 作用 时 ， 类 型 和 类 就 是 分 
类 这 种 观点 有 时 具有 适得其反 的 效果 。 尤 其 对 于 动态 类 型 语言 这 样 不 太 
重视 类 型 的 语言 。 


本 方 我 们 将 深入 探讨 使 用 类 来 实现 代码 再 利用 的 方法 。 


i 一 种 事物 在 多 个 分 类 中 


把 文件 放 进 不 同文 件 夹 进行 整理 时 ， 常 常会 有 这 个 或 者 那个 文件 该 
放 入 哪个 文件 夹 的 烦恼 。 这 是 因为 现实 世界 中 的 物 并 不 仅仅 属于 某 一 种 


分 类 。 


举 个 具体 的 例子 ， 假 设 要 把 公司 职员 进行 分 类 。 把 公司 职员 这 个 类 
的 元 素 ( 即 职员 ) 进行 分 类 ， 定 义 程 序 员 类 ， 同 时 也 定义 不 同 岗位 的 业 
务 员 类 。 如 有 果 说 业务 部 的 职员 小 李 也 会 编写 程序 ， 那 究竟 该 把 小 李 放 和 人 
程序 员 类 还 是 业务 员 类 呢 ? 


一 个 人 同时 素 担 程序 员 和 业务 员 的 角色 的 情况 是 完全 有 可 能 的 。 那 
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么 一 个 类 同时 作为 多 个 类 的 子 类 的 情况 就 是 很 卓然 的 了 。 也 束 古 说 现实 
世界 中 一 种 事物 有 可 能 属于 多 种 分 类 。 为 了 实现 对 这 种 现实 情况 的 模 
拟 ， 作 为 工具 的 程序 设计 语言 是 不 是 应 该 文 持 对 多 个 类 的 继承 呢 ?” 这 就 
是 多 重 继 承 的 初衷 。 


I 多 重 继承 对 于 实现 方式 再 利用 非常 便利 


多 重 继 承 对 于 实现 方式 再 利用 是 一 种 非常 便利 的 方法 。 图 12.6 展示 
的 就 是 多 重 继承 的 一 个 例子 。 珊 有 沫 单 栏 的 窗口 这 种 类 继 兴 了 窗口 类 并 
日 实现 了 采 单 柱 的 操作 。 为 外 ， 吊 有 滚动 位 的 窗口 类 也 继承 了 窗口 类 ， 
并 且 实 现 了 能 滚动 内 容 的 滚动 栏 的 功能 。 如 采 要 实现 一 种 既 具 有 沫 单 栏 


又 具有 滚动 栏 的 窗口 该 怎么 做 呢 ? 在 文 持 多 重 继 江 的 语言 中 ， 只 需要 继 
承 两 个 类 就 可 以 实现 。 


上 1 图 12.6 GUI 和 多 重 继承 


人 继承 了 B 


同时 带 有 菜单 栏 和 滚动 条 的 窗口 类 


另外 ， 作 为 实际 使 用 的 代码 的 一 个 例子 ， 我 们 来 看 从 Python 语言 标 
准 库 SocketServerpy 中 取出 的 四 行 代码 。 


Python 标准 库 中 使 用 的 多 重 继承 示例 


class ForkingUDPServer (ForkingMixIn, UDPServer): pass 
class ForkingTCPServer (ForkingMixIin, TCPServer): pass 
class ThreadingUDPServer (ThreadingMixIn, UDPServer): pass 


class ThreadingTCPServer (ThreadingMixIn, TCPServer): pass 
这 段 代 码 定义 了 四 个 子 类 ， 用 来 表示 在 通信 中 使 用 UDP 还 是 TCP 
以 及 并 行 处 理 中 使 用 fork 还 是 thread。 这 四 个 子 类 是 由 两 个 选项 结合 两 
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还 是 有 冲突 | 203 


个 类 做 多 重 继承 定义 的 (图 12.7 )。pass 一 词 的 意思 是 没有 特殊 的 处 理 。 
比如 和 定义 ForkingUDPServer 只 需要 继承 ForkingMixIn 和 UDPServer 就 
可 以 完成 ， 不 需要 其 他 的 代码 。 


1 图 12.7 ”Python 标准 库 中 使 用 的 多 重 继承 


class ForkingMixlIn class ThreadingMixlIn 
fork 的 并 行 处 理 方式 thread 的 并 行 处 理 方 式 
x 全 
Blas UDP class ForkingUDPServer 
, UDP 的 通信 方式 


class ThreadingUDPServer 
thread 的 并 行 处 理 方式 、 


UDP 的 通信 方式 


class TCPServer class ForkingT CPServer class ThreadingTCPServer 
TCP 的 通信 方式 | < fork 的 并 行 处 理 方式 、 thread 的 并 行 处 理 方式 、 


TCP 的 通信 方式 TCP 的 通信 方式 


(Ae: 
多 重 继承 的 问题 一 一 还 是 有 冲突 


多 重 继 承 看 起 来 真 的 很 方便 。 但是， 使 用 多 重 继承 时 该 如 何 解 决 名 
字 解 释 的 问题 呢 ? 当 问 到 类 中 x 值 是 什么 时 ， 该 如 何 回答 呢 ? 
首 完 ， 如 末 这 个 类 本 里 知道 答案 ,就 直接 给 出 回答 (图 12.8 )。 


1 图 12.8 名 字 解 释 之 1 


Parent 


A OX 为 何 值 ? 


四 为 AI 


其 次 ， 如 果 这 个 类 本 身 不 知道 答案 ， 就 去 问 它 的 父 类 再 给 出 回答 
(图 12.9 )。 
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合 X 为 何 值 ? 
@ 为 Al 


@ X 为何 值 ? 
四 不 知道 ， 向 父 类 查询 


1 图 12.9 ”名字 解释 之 2 


Parent 
x a "A 和" 


加 为 AI 


那么 ， 像 下 面 的 代码 中 展现 的 多 个 父 类 具有 相同 名 字 的 方法 时 会 怎 
么 样 呢 ? 
EEC9 


class ParemntA : 


se WA 


class ParentB: 


se 二 WW 局 WW 


class Child(ParentA, ParentB) : 


pass 


BEdne cnila > 4 TE el 


究竟 应 该 调用 哪个 方法 呢 ? 这 里 再 一 次 出 现 了 名 字 解 释 的 问题 ( 图 
1 10 


有 名字 解释 之 3 
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| 解决 方法 1: 禁止 多 重 继承 


Java 语言 中 就 禁止 了 类 的 多 重 继承 。 只 要 不 认可 类 的 多 重 继承 这 种 
方式 ， 就 不 会 有 上 述 问题 。 这 样 可 以 把 问题 解决 得 很 干脆 ， 只 是 会 以 失 
去 多 重 继 承 的 良好 便利 性 为 代价 。 

除 此 之 外 ， 在 Java 语言 及 其 相关 库 中 也 可 以 观察 到 舍弃 作为 实现 方 
式 再 利用 的 继承 的 倾 癌 。 比 如 图 形 工 具 套装 的 实现 就 是 这 样 。1995 年 发 
布 的 Abstract Window Toolkit ( AWT ) 中 ， 它 是 通过 继承 对 各 种 方法 进 
行 重 载 的 。 而 现在 在 Eclipse 等 语言 中 使 用 的 Standard Widget Toolkit 
( SWT ) 却 不 允许 再 使 用 继承 。 


有 委托 

取而代之 发 展 起 来 的 概念 是 委托 “。 这 种 方法 定义 了 具有 待 使 用 实现 
方式 的 类 的 对 象 ， 然 后 根据 需要 使 用 该 对 和 象 来 处 理 。 使 用 继承 后 ， 从 类 
型 到 命名 空间 都 会 被 一 起 继承 ， 从 而 导致 问题 的 发 生 ， 这 种 方法 只 是 停 
留 在 使 用 对 象 的 层面 上 。 

下 面 一 段 代 码 显示 了 一 个 使 用 委托 的 例子 。 


public class TestDelegate { 


DUBlie ste vo mm ec eman ro 
me ee 


new UseDelegate() .useHello(); // -> hello! 


class Hello{ © 
DOING 
SSwEm 本 SET EEC 


} 


(DD 委托 ( delegation ) 也 叫做 聚集 (aggregation ) 或 者 咨询 (consultation )。 
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class UseInheritance extends Hello { © 
Bublic voi VeeHellolD 
nellol().: © 
} 
} 


class UseDelegate { 4) 
Hello h = new Hello(); © 
public void useHello()f{ 

Ferme O 


} 


显示 “Hello !” 的 方法 hello 为 类 Hello 所 持 有 (和 @@ ) 类 UseInheritance 
通过 继承 类 Hello 自身 也 持 有 了 方法 hello (四 ) 并 加 以 使 用 (), 与 之 
不 同 ， 类 UseDelegate 并 没有 继承 类 Hello( @ )， 而 是 通过 人 句 @ 持 有 了 类 
Hello 的 对 象 。 当 有 和 需要 使 用 时 通过 句 @ 将 需要 的 处 理 委托 给 该 对 象 
操作 。 

与 从 多 个 类 中 继承 实现 强 耦 合 的 方式 相 比 ， 使 用 委托 进行 耦合 的 方 
式 显然 要 更 好 一 些 。 对 于 委托 的 使 用 ， 也 不 需要 在 源 代码 中 写 死 ， 而 是 
可 以 通过 配置 文件 在 合适 的 时 候 注 入 运行 时 中 去 。 这 个 想法 众生 了 依赖 
注入 (Dependency Injection ) 的 概念 。 


和 接口 

刚刚 提 到 Java 语言 中 禁止 了 多 重 继承 ， 但 它 也 具备 实现 多 重 继承 的 
功能 。 这 就 需要 借助 接口 (interface ) "。 

接口 是 没有 实现 方式 的 类 。 它 的 功能 仅仅 在 于 说 明 继 水 了 该 接口 的 
类 必须 持 有 某 某 名 字 的 方法 。 多 重 继 承 中 发 生 的 问题 是 多 种 实现 方式 相 
冲突 时 选取 哪个 的 问题 。 而 在 接口 的 多 重 继承 中 ， 尽 管 有 多 个 持 有 某 某 
方法 的 信息 存在 ， 但 这 仅仅 表明 持 有 某 某 方 法 ， 不 会 造成 任何 困扰 。 下 
面 一 段 代码 中 就 继承 了 持 有 相同 名 字 的 方法 的 两 个 类 ， 编 译 时 不 会 发 生 


(D Java 语言 中 类 的 继承 用 extends， 接 口 的 继承 用 implements 来 区 别 表示 。 另 外 接 
口 的 继承 也 称 为 实现 。 
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ED 


bublic class TestMualtiimpl implementes Eoo, Bar 
Duelic void hellol() 
syseemiome en 


interface Foo { 


ul tem or el ne 


interface Bar { 


Bellie Yold 三 slLoO() 7 


这 段 代 码 中 ， 类 TestMultiImpl 继承 了 Foo 和 Bar 两 个 接口 。 如 果 这 
个 类 中 不 实现 public void hello 0， 编 译 时 将 出 现 “ 没 有 实现 应 该 实现 的 
方法 ”这 样 的 错误 ”。 也 就 是 说 , 继承 了 接口 Foo 后 , 这 个 类 就 作为 一 种 
类 型 表现 出 必须 持 有 public void hello 0 的 特点 ， 可 以 让 编译 器 对 它 进 行 
类 型 检查 。 

Java 语言 为 了 仅 实现 功能 上 的 多 重 继承 引入 了 接口 。PHP 语言 和 
Java 语言 一 样 不 认可 多 重 继 承 ， 并 从 2004 年 发 布 的 PHP5 开始 引入 了 
接口 的 概念 。 


| 解决 方法 2: 按 顺序 进行 搜索 

注 经 也 有 些 语言 试图 通过 明确 定义 搜索 顺序 来 解决 冲突 间 题 。 但 是 
该 如 何 定义 呢 ? 如 果 单 纯 定义 说 当前 类 回答 不 了 时 就 去 检查 首先 书写 的 
(左边 的 ) 类 ， 按 这 样 的 顺序 深度 优先 搜索 法 ) 可 行 吗 ? (图 12.11 ) 


Java 语言 中 可 以 对 名 字 相 同 但 参数 类 型 不 同 的 方法 进行 重 载 。 因 此 ， 准 确 来 讲 ， 
这 里 说 的 名 字 应 该 是 签名 。 

@ 具体 来 讲 ， 提 示 的 错误 消息 应 该 是 “TestMultiImpl 不 是 abstract 的 ，Foo 中 的 
abstract 方法 hello( ) 没有 被 重 载 ”。 
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和 图 12.11 从 左边 开始 搜索 的 顺序 


@ 询问 x 为 何 值 
@ 自己 不 知道 时 ， 首 先 查询 左边 的 父 类 
自 左边 的 父 类 不 知道 时 ， 查 询 右 边 的 父 类 


有 深度 优先 搜索 法 的 问题 
遗憾 的 是 这 种 方法 可 能 造成 不 自然 的 结果 。 请 看 下 面 的 代码 。 
GD 


class Parent: 


小 三 克 信 了 


euler 人 mL Gd (DB 有 于 全 有 记 ) : 


区 EM 
BELAE Calledl.,w #-> 重 载 之 后 变 成 B 


class Base: 


Se 二 WWW 


class Derivedl (Base): 


pass 


class Derived2 (Base): 


se WW 


class Multi (Derivedl1l, Derived2): 


pass 


print MUIt1.x <4-> 广 出 何 值 ? 


从 类 Base 继承 了 两 个 类 Derivedl 和 Derived2。 义 有 一 个 类 Multi 
从 这 两 个 类 继承 出 来 。 这 样 产 生 的 继承 关系 叫 雁 形 继承 。 
方法 是 可 以 被 重 载 ( override ) 的 。 几 12.12 的 左边 的 Parent 中 定义 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


12.3 ”多 重 继承 的 问题 一 一 还 是 有 冲突 | 209 


的 x 在 Child 中 就 被 重 载 了 。 因 此 Child 中 的 x 值 变 成 了 重 载 后 的 值 。 
那么 图 12.12 右边 的 秦 形 继承 中 Derived2 方法 重 载 之 后 ，Multi.x 的 值 应 


该 是 多 少 呢 ? 


1 图 12.12 ” 重 载 和 鞭 形 继承 


Parent 
X 二 "A" 


Derived1 Derived2 
xX="B" 
Wp SY 


查询 X 为 何 值 时 
如 何 回答 ? 


人 @@X 为 何 值 ? 
四 为 Bl 


Multi 首先 检查 左边 的 父 类 Derivedl1，Derivedl 再 检查 它 的 父 类 
Base， 结 果 是 A。 es 2.1( 2001 年 ) 就 是 加 循 这 种 方式 的 ( 深度 优 
先 搜索 法 )。 然 而 使 用 这 种 方法 的 话 ， 初 始 的 x 和 重 载 后 的 x 混合 后 的 
结果 仍然 是 初始 的 x。 这 样 一 来 ， 好 不 容易 重新 定义 的 x 丢失 了 。 

为 了 回避 这 一 问题 ， 从 Python 2.3 (2003 年 ) 开始 使 用 C3 线 
性 化 。 

外 C3 线性 化 确定 顺序 

C3 线性 化 是 于 1996 年 提出 来 的 一 种 算法 “, 它 对 类 进行 编号 以 满足 

以 下 两 个 约束 条 件 : 
父 类 不 比 子 类 先 被 检查 
e 如 有 果 是 从 多 个 类 中 继承 下 来 则 优先 检查 先 书 写 的 类 


QD 2001 年 发 布 的 Python 2.2 中 引入 了 一 种 新 风格 的 类 ( new-style class )， 同 时 决定 
方法 搜索 顺序 的 算法 也 得 到 了 改良 。 但 是 ,文档 上 的 理论 和 实际 实现 之 间 有 种 种 
差异 ， 几 经 波折 之 后 ，Python 2.3 还 是 确定 采用 C3 线性 化 。 

@ 在 OOPSLA'96 的 活动 上 ，Kim Barrett 等 人 发 表 了 题 为 “A Monotonic Superclass 


Linearization for Dylan” 的 演讲 。 
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之 所 以 出 现 重 载 后 的 值 变 回 初始 值 ， 就 是 因为 父 类 先 于 子 类 被 检 


查 。 因 此 ， 在 此 有 针对 性 地 加 上 了 第 一 个 结束 条 件 (图 12.13 )。 
和 图 12.13 左 : 深度 优先 的 搜索 顺序 右 : C3 线性 化 的 顺序 


Base 先 于 Derived2 
被 查询 


子 类 先 于 父 类 
被 查询 


下 面 的 代码 反映 了 使 用 深度 优先 搜索 法 的 Python 2.1 和 采用 了 C3 
线性 化 顺序 的 Python 2.3 以 后 的 版 本 之 间 程 序 行为 的 差别 。 


# 尽管 在 Derived2 中 对 x 进行 了 重新 定义 
# 到 Multi 后 又 回 到 了 原来 的 情况 
Glass Base: 


3 三 1 从 1 
class Derivedl (Base): pass 


class Derived2 (Base): 
x = 'B' # 重新 定义 


Clase Mlti(Derivedql Derivegq>) -pass HDerivedl 人 在 加 


elm MEd ,Se WS UA 
# 人 没有 使 用 Derived2 中 的 定义 


# new-style class ( 继承 目 object， 使 用 c3 线 性 化 ) 
# Derived2 中 定义 的 'B 被 Multi 继 承 下 来 了 
class Base(object) : 


3 二 DAT 
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class Derivedl (Base) : pass 


class Derived2 (Base): 


x = 'B' # 重新 定义 
class Multi (Derivedl1l, Derived2): pass 
je Mel ,到 排 = 室 1! 昌 1 
# 1 个 使 用 了 Derived2 中 的 定义 


Perl 语言 曾经 允许 在 库 的 层面 交 蔡 使 用 深度 优先 搜索 法 、 广 上 度 优 先 
搜索 法 ”和 C3 线性 化 。 从 Perl 6 开始 已 采用 C3 线性 化 的 方法 作为 默认 
的 程序 行为 。 


| 解决 方法 3: 混入 式 处 理 


原本 ， 问 题 是 指 从 一 个 类 到 它 的 祖先 类 ”有 多 种 追溯 方法 。 既 然 如 
TR SRD git da i 
合 在 一 起 不 就 行 了 吗 ? 我 们 把 这 种 设计 方针 、 混 入 式 处 理 方式 和 用 来 混 
入 的 小 的 类 统称 为 混 人 处 理 ( Mix-in )。 据 说 “Mix-in 一 词 起 源 于 C++ 语 
言 设 计 考 斯 特 芳 斯 特 卢 普 经 党 光顾 的 MIT( 麻 省 理工 学 院 ) 附近 的 一 家 
甜品 屋 ， 指 的 是 把 坚果 、 葡 萄 干 和 冰淇淋 混合 在 一 起 “。 

疤 形 继承 在 使 用 了 Mix-in 之 后 就 可 以 变形 为 非 汉 形 继承 。 图 12.14 
的 左 侧 展示 的 是 类 AB 从 类 A 继承 并 添加 了 方法 B， 类 AC 从 类 C 继承 
并 添加 了 方法 C， 进 而 从 类 AB 和 类 AC 做 多 重 继承 得 到 了 类 ABC。 石 
侧 展 示 的 是 通过 从 类 A 和 做 混入 处 理 用 的 类 B、 类 C 按 实际 需要 继承 得 
到 类 AB、 类 AC、 类 ABC。 这 种 方法 不 仅 消 除了 委 形 继承 ,而且 继承 


Q) 简单 来 说 ， 这 是 一 种 先 将 所 有 直接 父 类 穷尽 再 去 检查 父 类 的 父 类 的 搜索 方法 。 

@) 祖先 类 是 包括 了 父 类 以 及 父 类 的 父 类 等 的 统称 。 

(3) 请 参考 斯 特 劳 斯 特 卢 普 《Ct++ 语言 的 设计 与 演化 》 http:/www.stroustrup.comy/dne. 
html, 

4) 笔者 也 曾 去 过 那 家 甜品 屋 吃 过 冰淇淋 ， 能 按 自己 独特 的 需求 配制 出 心仪 的 口味 的 
冰淇淋 是 件 提 有 趣 的 事情 。 
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树 的 深度 也 减少 了 一 层 。 


1 图 12.14 左 : 菱形 继承 右 : 使 用 Mix-in 消除 萎 形 继承 


class ABC 


(EXO 


仅 使 用 类 使 用 Mix-in 


class ABC 


和 Python 语言 

Mix-in 这 种 编程 风格 本 号 并 不 依赖 于 语言 处 理 希 ， 即 使 不 被 文 持 
也 可 以 使 用 。 在 12.2 节 SocketServer.py 的 多 重 继承 这 个 例子 中 ， 
ForkingMixIn 和 ThreadingMixIn 就 是 为 实现 混入 式 多 重 继承 的 小 型 的 
类 。 通 党 这 些小 型 的 类 最 小 限度 地 定义 了 一 些 方法 ， 起 到 了 作为 代码 再 
利用 单位 的 作用 。 然 而 它们 却 不 用 于 单独 创建 实例 。 为 了 表明 这 一 点 ， 
Python 语言 会 在 该 类 的 名 字 中 加 上 MixIn 来 标识 。 


和 Ruby 语言 中 

Ruby 语言 采用 的 规则 是 : 类 是 单一 继承 的 而 模块 则 可 以 任意 数量 地 
做 温 入 式 处 理 。 模 块 无 法 创建 实例 ， 但 可 以 像 类 一 样 拥 有 成 员 变 量 和 方 
法 。 也 就 是 说 ,模块 实 质 上 是 从 类 中 去 除了 实例 创建 功能 。 即 使 类 的 多 
重 继承 被 禁止 了 ， 通 过 使 用 模块 的 Mix-In 方式 照样 可 以 实现 对 实现 方式 
的 再 利用 “。 

下 面 的 代码 中 ， 模 块 Hello 中 定义 了 方法 hello， 模 块 Bye 中 定义 了 
方法 bye， 类 Greeting 是 这 两 个 类 混入 式 处 理 的 结果 。 最 后 两 行 代码 的 


Q) Mix-in 并 不 能 解决 所 有 的 名 字 冲 突 的 问题 。 图 12.14 右 侧 的 类 A 和 mixin B 或 者 
mixin B 和 mixin C 有 相同 名 字 的 方法 时 ， 仍 然 会 导致 冲突 的 产生 。 
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运行 结束 证 实 了 Greeting 的 对 象 同时 具有 方法 hello 和 方法 bye。 


moe ee ke 
le 
pues eon 
end 


end 


module Bye 
def bye 
Duesy oven 
end 


end 


class Greeting 
include Hello 
include Bye 


end 


Greeting.new.hello #-> hello! 


Greeting.new.bye #-> bye! 


I 解决 方法 4: Trait 


多 重 继 承 在 一 开始 是 如 何 导 致 问题 发 生 的 ? 发 表 于 2002 年 的 一 篇 
关于 Trait 的 论文 ”很 好 地 整理 了 其 中 的 问题 点 。 

类 具有 两 种 截然 相反 的 作用 。 一 种 是 用 于 创建 实例 的 作用 ， 它 要 求 
类 是 全 面 的 、 包 含 所 有 必需 的 内 容 的 、 大 的 类 。 另 一 种 是 作为 再 利用 单 
元 的 作用 ， 它 要 求 类 是 按 功 能 分 的 、 没 有 多 余 内 容 的 、 小 的 类 。 

当 类 用 于 创建 实例 时 ， 作 为 再 利用 单元 来 说 就 显得 太 大 了 。 既 然 如 
此 ， 如 果 把 再 利用 单元 的 作用 特别 化 ， 设 定 一 些 更 小 的 结构 ( 特性 = 方 
法 的 组 合 ) 是 不 是 可 以 呢 ? 这 就 是 Trait 的 初衷 。 这 和 类 另外 去 定义 再 


Nathanael Schaerli, Stephane Ducasse, Oscar Nierstrasz, Andrew Black, “Traits: 
Composable Units of Behaviour” , 2002. 
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利用 单元 的 方法 不 同 ， 和 Ruby 语言 中 的 模块 很 相似 。 那 么 它们 之 间 有 
什么 差别 呢 ? 


和 名 字 冲 突 时 的 程序 行为 
我 们 首先 来 看 Ruby 语言 的 问题 点 。 


module Foo 


def hello 


DuaseEeoon 
end 


end. 


module Bar 


leraene 
Bue MoaEely 
end 
end 


class Foobar 
ijnclude Foo 
Incluae Bar 


end. 


class Barfoo 
jncjude Bar 
jnclude Foo 


end. 


Foobar.new.hello Hn 


Barfoo.new.hello #-> foo! 


在 这 上 段 代 人 码 中 ， 类 Foobar 中 include 了 模块 Foo 和 模块 Bar。 但 是 
这 两 个 模块 都 拥有 方法 hello， 于 是 产生 了 冲突 。Ruby1.9.3 规定 发 生 类 
似 的 冲突 时 ， 默 认 选 取 最 后 被 include 的 类 Bar 中 的 方法 hello。 这 样 一 
来 ,程序 员 就 会 忽略 冲突 的 存在 。 一 旦 include 的 顺序 变 成 类 Barfoo 中 
那样 ， 程 序 行为 义 不 一 样 了 。 

Trait 的 设计 使 得 即使 顺序 改变 了 程序 的 行为 也 不 会 变 。 发 生 名 字 冲 
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突 时 ,程序 会 明确 地 发 布 错误 信息 。 作 为 Smalltalk 语言 处 理 带 之 一 的 
Squeak 就 提供 了 为 方法 取 别 名 和 指定 不 参与 冲突 的 方法 等 冲突 的 解决 
2 

和 提供 的 方法 和 所 需 的 方法 

实际 上 前 面 草 节 提 到 的 Python 语言 中 Mix-In 的 例子 里 也 存在 问题 。 
在 Python 语言 的 标准 库 中 ， 将 ForkingMixIn 混入 类 UDPServer 中 创建 
了 一 个 新 的 类 。ForkingMixIn 属于 不 能 创建 实例 的 类 。 那 UDPServer 是 
能 够 创建 实例 的 类 么 ” 比如， 如果 没有 ForkingMixIn 提供 的 方法 
process_request， 程 序 还 能 执行 么 ”如 果 是 那 种 非 混入 式 地 提供 方法 
process_request 不 可 的 类 ， 那 么 “可 以 单独 用 来 创建 实例 ”这 一 说 法 就 
多 少 显 得 有 些 误 导 了 。 

Python 的 问题 在 于 缺少 一 种 手段 来 表明 类 在 什么 状态 下 是 可 以 创建 
实例 的 。Scala 语言 的 Trait 技术 中 提供 了 方法 来 声明 何 种 方法 为 必要 的 。 
如 图 12.15，Trait 提供 的 方法 用 圆圈 、Trait 需要 的 方法 用 租 尖 表示 。 
UDPServer Trait 需要 方法 process request， 同 时 Forking Trait 提供 了 方 
法 process _ request。 通过 两 者 的 组 合 得 到 了 可 以 创建 实例 的 类 
ForkingUDPServer。 


1 图 12.15 ”提供 的 方法 和 需要 的 方法 


trait UDPServer 
UDP 的 通信 方式 
process_request 


trait Forking 
fork 的 并 行 处 理 方 式 
process_request 


组 合 图 例 
一 提供 的 方法 
| 一 了 需要 的 方法 


class ForkingUDPServer 


trait UDPServer trait Forking 
process_request FO process_request 
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由 其 他 各 功能 

另外 ， 可 以 利用 已 有 的 Trait， 通 过 改写 某 些 方法 定义 新 的 Trait 实 
现 继承 。 还 可 以 通过 组 合 多 个 Trait 实现 新 的 Trait。 这 就 是 Trait 的 概要 
说 明 。 它 一 方面 把 问题 葡 当 地 分 而 治之 ， 一 方面 又 因为 功能 烷 多 令 人 困 
惑 。 谈 者 们 想必 都 还 记得 goto 语句 就 是 因为 其 功能 过 于 强大 而 退出 历史 
的 舞台 的 吧 。 所 以 说 力量 过 于 强大 未 必 是 件 好 事 。 
和 Trait 逐渐 被 广泛 采纳 

Trait 最 早 是 在 Squeak 语言 中 引入 的 。 同 样 使 用 了 Trait 的 还 有 
Scala 语言 。 但 是 或 许 是 因为 这 两 种 语言 对 类 型 的 态度 的 差别 ， 其 中 
Trait 的 实现 方式 各 有 党 简 。Perl 6 也 引入 了 和 Trait 相似 的 功能 ， 称 为 
Roll。PHP 语言 也 从 $.4 版 本 开始 引入 这 种 功能 。Ruby 语言 则 在 2.0 版 
本 中 引入 了 mix method， 可 以 像 Trait 一 样 操作 模块 。 


12.4 
小 结 


有 这 么 多 的 解决 方法 ， 哪 个 才 是 最 好 的 呢 ? 这 因 具 体 情 况 而 寞 。 我 
们 了 解 了 Trait 这 种 方法 的 提出 以 及 逐渐 被 很 多 语言 采纳 的 过 程 ， 它 看 
起 来 是 一 种 很 有 前 途 的 方法 。 

不 可 和 否认， 现在 看 起 来 是 最 佳 的 解决 方案 将 来 难保 还 是 最 佳 。 或 许 
10 年 20 年 后 会 被 更 好 的 解决 方案 取代 ， 像 动态 作用 域 一 样 被 淘汰 出 局 。 

然而 ， 笔 者 认为 ，Trait 技术 是 一 个 很 好 的 开端 。 它 认为 类 同时 具有 
的 作为 再 利用 单元 和 实例 生成 硕 的 两 种 作用 是 相反 的 。 或 许 类 这 一 概念 
作为 面 回 对 象 的 根基 具有 不 可 动 播 的 地 位 。 然 而 这 一 概念 本 吴 也 是 从 一 
个 秩 形 慢 慢 发 展 得 越 来 越 复 杀 ， 进 一 步 整理 之 后 再 逐渐 让 小 出 东 些 功能 
的 。 现 在 备 受 关注 的 Trait 和 一 些 其 他 概念 也 必 将 不 断 地 演变 下 去 。 经 
过 长 时 间 琢 磨 沉 演 ， 一 部 分 将 缀 于 成 熟 被 推广 使 用 ， 最 后 将 变 成 现在 的 


(D RubyConf 2010 Keynote(2), http:/www.rubyist.net/~matz/20101113.html. 
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静态 作用 域 和 while 语句 那样 被 认为 是 理所当然 的 存在 。 


从 头 开始 逐 章 手 抄 


针对 面 对 庞大 信息 量 心力 交 阅 时 该 怎么 办 的 问题 ， 我 们 在 第 6 草 “ 学 习 
讲求 细 吐 慢 咽 ”专栏 中 介绍 了 三 种 方法 。 第 一 种 方法 是 “从 需要 的 地 方 开始 
阅读 ”"， 第 二 种 方法 是 “ 先 掌握 概要 再 阅读 细节 ”( 第 8 章 )。 当 这 两 种 方法 
都 不 奏效 时 ， 就 要 采用 最 后 一 招 一 一 从 头 开始 逐 草 手 抄 。 

当 没 有 明确 要 做 的 事情 或 者 想 要 了 解 的 东西 时 ， 当 简单 浏览 的 内 容 过 目 
即 忘 时 ， 以 这 种 学 习 状 态 ， 不 管 怎么 学 也 无 法 获得 真知 。 

因此 ， 为 了 打 基 础 抄写 教科 书 吧 。 不 学 习 光 唉 声 叹 气 是 徒劳 无 用 的 ， 不 
如 什么 也 不 多 想 估 且 先 做 知识 的 搬运 工 。 

除 此 之 外 别 无 它 法 。 笔 者 有 一 种 比较 喜欢 的 方法 ， 按 时 间 段 来 衡量 学 习 
效果 ， 比 如 每 隔 25 分 钟 看 自己 学 到 了 多 少 。 当 然 按 学 习 量 来 衡量 也 是 可 以 
的 。 重 要 的 是 设 定 足以 获得 成 就 感 的 合适 的 学 习 间 隔 。 
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由 于 篇 幅 所 限 ， 本 书 只 论述 了 程序 设计 语言 的 一 些 重点 话题 。 布 望 
读者 在 阅读 本 书后 能 获得 一 个 整体 性 认识 。 

如 果 你 读 过 本 书 之 后 ， 对 某 些 话题 的 产生 了 兴趣 ， 想 要 了 人 解 更 详细 
的 内 容 ， 那 是 最 好 不 过 。 兴 趣 提 升学 习 效 率 ， 兴 之 所 至 ， 才 能 学 得 深 、 
学 得 透 。 在 学 习 了 详细 内 容 之 后 ， 回 过 头 来 再 看 这 一 整体 框架 就 更 容易 
理解 了 。 

接 下 来 ， 我 束 对 本 书 未 能 尽 述 的 内 容 做 个 简略 的 补充 。 

本 书 提 到 一 个 问题 会 有 多 种 解决 方法 ， 或许 有 读者 想 知 道 究 苋 哪 种 
方法 是 最 好 的 。 那 些 敢 做 出 断言 的 宗教 人 士 或 占 卡 师 似 乎 回来 人 气 很 
高 ， 然 而 ， 现 实 中 的 大 部 分 问题 都 需要 具体 问题 具体 分 析 ， 很 难 讲 哪 种 
最 好 。 最 佳 设 计 方 案 也 会 因 要 求 的 不 同 而 加 以 修正 。 针 对 假设 的 特定 情 
况 进行 的 速度 等 的 最 优化 ， 有 可 能 影响 某 种 方案 在 其 他 情况 下 的 应 用 。 
关于 该 话题 ， 读 者 可 以 关注 富豪 式 程序 设计 和 YAGNI 等 关键 字 "。 

可 以 说 ， 只 要 是 编程 ， 大 概 都 不 可 避免 要 产生 一 些 错误 (bug )。 为 
了 使 程序 准确 运行 ， 就 需要 调试 ( debug )。 错 误 是 由 程序 解释 和 现实 情 
况 不 一 致 引起 的 。 要 尽早 发 现 错误 的 存在 ， 可 以 使 用 assertion 、test 等 
表达 程序 应 有 行为 的 解释 性 语句 。 要 尽早 地 发 现 错误 产生 的 原因 ， 可 以 
去 学 习 调 试 的 方法 论 和 调试 工具 的 使 用 方法 。 基 于 Jenkins 等 平台 的 持 
续集 成 ( continous integration ) 可 以 频繁 进行 目 动 软件 测试 ， 从 而 能 太 
早 发 现存 在 的 问题 。 

现在 的 编程 不 再 单一 枯燥 。 价 助 编辑 带 可 以 实现 语法 着 色 ， 借助 
Eclipse 等 集成 开发 环境 可 以 在 后 人 台 进 行 编译 ， 并 在 有 问题 的 代码 下 面 用 
波浪 线 标示 。 这 些 功 能 让 编程 工作 变 得 丰 定 多彩。 但 还 有 人 想 使 编程 变 


Q) 富豪 式 程序 设计 是 日 本 图 形 用 户 界 面 设计 专家 增 井 俊 之 倡导 的 编程 风格 。 它 主要 
针对 用 户 界 面 开 发 ， 主 张 为 了 实现 简单 直观 的 界面 可 以 不 惜 代 码 方面 的 投入 。 与 
此 成 鲜明 对 比 的 是 YAGNI( You aren 't gonna need it, 你 不 会 需要 它 ) 的 编程 思想 ， 
它 主张 程序 员 不 应 该 添加 任何 当前 认为 不 需要 的 功能 。 译 者 注 
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得 更 加 轻松 ， 于 是 出 现 了 Emacs 等 一 些 编辑 融 的 代码 上 自动 补充 功能 、 
Snippet 插件 和 Eclipse 中 的 Quick Fix 这 样 能 大 大 减轻 代码 输入 压力 的 功 
能 。 而 对 于 一 些 语言 来 讲 ， 某 些 集成 开发 环境 提供 的 代码 重 构 ( code 
refactoring ) 文 持 也 是 非常 有 益 的 。 

如 果 你 在 一 个 团队 中 从 事 开 发 工作 ， 那 就 必然 会 关心 源 代码 的 版 本 
管理 和 代码 可 读 性 的 问题 。 这 在 单 人 编程 工作 中 同样 需要 考虑 。 因 为 写 
完 程序 一 个 月 后 你 可 能 就 不 再 是 当初 的 你 ， 早 已 忘记 了 那些 当初 没有 在 
代码 中 体现 出 来 的 编程 的 前 提 事 项 。 另 外 ， 不 单 对 目 己 的 程序 ， 还 有 必 
要 去 好 好 理解 他 人 编写 的 程序 。 

我 们 很 容易 更 加 关注 How 的 问题 ( 即 如 何 去 实 现 )， 实 际 上 ，What 
(要 实现 什么 ) 和 Why (为 什么 要 实现 ) 的 问题 也 是 不 可 忽略 的 。How 
充其量 只 不 过 是 手段 。 然 而 时 间 是 有 限 的 ,干劲 是 宝 贯 的 ， 要 把 它们 用 
在 真正 需要 的 地 方 。 几 此 种 种 ， 书 不 尽 言 ， 篇 幅 所 限 ， 至 此 搁 笔 。 
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